導(dǎo)讀
研究背景:
人乳頭瘤病毒(HPV)是宮頸癌的主要原因,HPV16和18是全球兩種流行的高危HPV類型。宮頸癌是女性中第二大常見(jiàn)的惡性腫瘤。每年有570,000名女性被診斷出患有宮頸癌,并且有311,000名女性死于這種疾病。盡管已知持續(xù)的HPV感染會(huì)導(dǎo)致宮頸癌,但目前尚不清楚HPV如何誘發(fā)癌變,以及在該過(guò)程中到底發(fā)揮什么重要的功能。HPV感染后,HPV蛋白E6和E7被表達(dá),其抑制腫瘤蛋白p53和視網(wǎng)膜母細(xì)胞瘤蛋白,破壞細(xì)胞增殖和許多其他生物學(xué)過(guò)程,并誘發(fā)宮頸癌。此外,HPV DNA也可能整合到人類DNA中,這是致癌過(guò)程中的早期重要事件。另外,癌癥的進(jìn)展可以通過(guò)病毒DNA整合入抑癌基因來(lái)解釋。這種整合入宿主DNA會(huì)使那些基因失活,從而導(dǎo)致生長(zhǎng)不受控制。了解病毒的致癌作用對(duì)于HPV陽(yáng)性癌癥的臨床治療至關(guān)重要。
結(jié)論:
作者通過(guò)Nanopore和Illumina測(cè)序?qū)ο惹鞍l(fā)表的樣品的整合位點(diǎn)進(jìn)行了重新測(cè)序。在對(duì)結(jié)果進(jìn)行分析之后,得出了三點(diǎn)結(jié)論:首先,從所有三個(gè)數(shù)據(jù)集(即,Nanopore,Illumina和已發(fā)布的數(shù)據(jù))中找到了19個(gè)先前發(fā)布的整合位點(diǎn)中的13個(gè),表明這些元素之間具有很高的重疊率和可比性;其次,與先前發(fā)表的論文相比,Nanopore和Illumina數(shù)據(jù)確定了66個(gè)獨(dú)特的整合位點(diǎn),其中13個(gè)已通過(guò)Sanger測(cè)序驗(yàn)證,這表明與公開(kāi)數(shù)據(jù)相比,作者的結(jié)果對(duì)整合位點(diǎn)的檢測(cè)靈敏度更高;第三,作者建立了可用于通過(guò)納米孔測(cè)序數(shù)據(jù)檢測(cè)HPV整合位點(diǎn)的pipeline,并且無(wú)需進(jìn)行糾錯(cuò)分析??偠灾?,與現(xiàn)有的Illumina數(shù)據(jù)分析pipeline方法相比,測(cè)試了一種新的納米孔數(shù)據(jù)分析方法,并證明了該方法在整合位點(diǎn)檢測(cè)中是可靠的,所需的測(cè)序數(shù)據(jù)更少。它提供了有力的證據(jù)和工具來(lái)支持納米孔在病毒狀態(tài)識(shí)別中的潛在應(yīng)用。
材料與方法
實(shí)驗(yàn)結(jié)果
一、數(shù)據(jù)質(zhì)控
作者通過(guò)對(duì)目標(biāo)區(qū)域捕獲后進(jìn)行文庫(kù)構(gòu)建,分別進(jìn)行Nanopore和Illumina測(cè)序,分別獲得130.2 Mb和1.64 Gb的clean?reads(圖1)。
?圖1
二、通過(guò)Nanopore和Illumina數(shù)據(jù)鑒定HPV整合位點(diǎn)
作者構(gòu)建Nanopore分析pipeline(圖2A),通過(guò)Blast與人和HPV16病毒基因組進(jìn)行比對(duì),共識(shí)別339個(gè)整合位點(diǎn),通過(guò)過(guò)濾篩選最終剩余60個(gè)位點(diǎn)進(jìn)行后續(xù)的分析。Illumina測(cè)序共獲得1718個(gè)整合位點(diǎn),篩選reads覆蓋度大于3的位點(diǎn)54個(gè)進(jìn)行后續(xù)分析。
?圖2
所有斷點(diǎn)在染色體上的分布見(jiàn)圖3A。染色體chr20、chr2、chr6分別由12、11和8個(gè)斷點(diǎn),chr1和chrX均存在7個(gè)斷點(diǎn),其余染色體斷點(diǎn)分布均在5以下。在每個(gè)位點(diǎn)上的reads覆蓋度從2~406不等,大約有31.7%以上的位點(diǎn)覆蓋深度在10以上。在top5的覆蓋深度位點(diǎn)中3個(gè)位于chr20(HPV16:2804,chr20:32516985 (406 reads);HPV16:7139,chr20:32478733(169 reads);HPV16:4276,chr20:32502143(51reads)),2個(gè)位于chrX(HPV16:5534,chrX:20464412 (132 reads);HPV16:3163,chrX: 20462930 (50 reads))。
圖3B展示了60個(gè)位點(diǎn)在HPV基因組上的分布,L2基因中有18個(gè),L1中有12個(gè),E1中有11個(gè),E2中有7個(gè),其他每個(gè)基因(E6,LCR,E5和E7)上小于4個(gè)。
在人基因組上,有38個(gè)位點(diǎn)在基因間區(qū),18個(gè)位于內(nèi)含子區(qū)域,2個(gè)位于非編碼區(qū)域,1個(gè)位于外顯子區(qū)域,1個(gè)位于downstream區(qū)域。
進(jìn)一步分析人基因組上的位點(diǎn)分布,在chr20染色體上的12個(gè)位點(diǎn)中,有10個(gè)在基因CHMP4B和RALY-AS1之間,有一個(gè)位于KIF3B和ASXL1之間,最后一個(gè)位于基因ATRN的內(nèi)含子區(qū)域。除了chr20染色體外,其他染色體上也有明顯的位點(diǎn)聚集趨勢(shì),例如,chrX染色體上的6個(gè)位點(diǎn)在基因RPS6KA3和CNKSR2之間,chr6染色體上的3個(gè)位點(diǎn)位于基因CAGE1的內(nèi)含子或者downstream區(qū)域。
圖3
三、在不同數(shù)據(jù)集中的位點(diǎn)差異
在Illumina測(cè)序獲得的54個(gè)整合位點(diǎn)中,有19個(gè)與之前報(bào)道的相符。整合所有位點(diǎn)并做韋恩圖(圖4),有13個(gè)位點(diǎn)是3種數(shù)據(jù)(Nanopore、Illumina、published)都存在的,這表明不同平臺(tái)間重復(fù)性很好。共有18個(gè)位點(diǎn)同時(shí)出現(xiàn)在Nanopore和Illumina中,三個(gè)位點(diǎn)同時(shí)出現(xiàn)在納米孔測(cè)序和以前發(fā)表的論文中,只有一個(gè)位點(diǎn)在Illumina和已發(fā)表的論文重疊。在兩個(gè)平臺(tái)中確定的整合位點(diǎn)中,一些斷點(diǎn)具有高度豐富的reads數(shù),例如HPV16:2804,chr20:32516985,Nanopore結(jié)果中有406個(gè)reads,Illumina結(jié)果中有1439個(gè)reads。其他斷點(diǎn)的reads數(shù)很少,例如HPV16:4250,chr21:97550764,其中Nanopore結(jié)果中有兩個(gè)reads,而Illumina結(jié)果中只有四個(gè)reads。
除了重疊的位點(diǎn)外,每個(gè)平臺(tái)都有自己獨(dú)特的整合位點(diǎn)。 Nanopore、Illumina和文獻(xiàn)中,分別擁有26、22和2個(gè)唯一的整合位點(diǎn)。在Nanopore識(shí)別的26個(gè)位點(diǎn)中,其中6個(gè)reads支持度在6以上。因此,在Illumina,Nanopore和文獻(xiàn)這三種方法確定的整合位點(diǎn)中,Nanopore具有相對(duì)可靠的豐度,可以確定準(zhǔn)確的整合位點(diǎn)。
?圖4
作者為了測(cè)試數(shù)據(jù)確定的新整合位點(diǎn)的準(zhǔn)確性,利用Sanger測(cè)序進(jìn)行驗(yàn)證??偣策x擇了14個(gè)整合位點(diǎn)進(jìn)行驗(yàn)證,并對(duì)13個(gè)進(jìn)行PCR擴(kuò)增并成功測(cè)序,表明這些整合位點(diǎn)的真正陽(yáng)性,這些陽(yáng)性位點(diǎn)大多由Nanopore和Illumina平臺(tái)鑒定。
圖5
四、受影響的基因功能分析
合并3種不同平臺(tái)的整合位點(diǎn),并對(duì)整合完的83個(gè)位點(diǎn)進(jìn)行注釋,并進(jìn)行了進(jìn)一步的功能分類和途徑分析。這些基因分為八個(gè)生物學(xué)過(guò)程,包括RNA聚合酶II啟動(dòng)子的轉(zhuǎn)錄正調(diào)控(6個(gè)基因),RNA聚合酶II啟動(dòng)子的轉(zhuǎn)錄負(fù)調(diào)控(6個(gè)基因),RNA聚合酶II啟動(dòng)子的轉(zhuǎn)錄調(diào)控(5個(gè)基因), RNA聚合酶II啟動(dòng)子的轉(zhuǎn)錄(4個(gè)基因),視黃酸受體信號(hào)傳導(dǎo)途徑的負(fù)調(diào)控(2個(gè)基因),皮膚屏障的建立(2個(gè)基因),近端/遠(yuǎn)端模式形成(2個(gè)基因)和胚胎肢體形態(tài)發(fā)生(2個(gè)基因)六個(gè)胞質(zhì)(13個(gè)基因),核質(zhì)(8個(gè)基因),胞外外泌體(8個(gè)基因),蛋白質(zhì)結(jié)合(6個(gè)基因),DNA結(jié)合(2個(gè)基因)和肌動(dòng)蛋白結(jié)合(2個(gè)基因)。
討論
數(shù)據(jù)表明,大多數(shù)整合位點(diǎn)存在于人類基因組的基因間區(qū)域中,與先前的研究一致。由于鑒定出人類基因組中有很大一部分(60%)的基因間區(qū)域,研究結(jié)果確定了約40%的整合位點(diǎn)位于人類基因組的基因間區(qū)域中,沒(méi)有顯著差異。因此,可以得出結(jié)論,整合位點(diǎn)在人類基因組中的分布方式受到基因組功能結(jié)構(gòu)性質(zhì)的影響。另外作者還發(fā)現(xiàn)整合發(fā)生在非編碼RNA中,它起著許多重要的功能,例如lncRNA與p53蛋白相互作用。插入ncRNA可能會(huì)導(dǎo)致更嚴(yán)重的功能中斷。其中HPV有插入的傾向,例如腫瘤蛋白63(TP63),它在致癌作用中起著非常重要的作用。
在這項(xiàng)研究中,作者確定了兩個(gè)基因CHMP4B和RALY-AS1。整合簇的趨勢(shì)非常強(qiáng),在76個(gè)獨(dú)特的整合位點(diǎn)以及其他幾個(gè)染色體區(qū)域中有10個(gè)整合位點(diǎn)。為什么病毒會(huì)整合到幾個(gè)特定區(qū)域,并且是隨機(jī)的還是特定的?需要進(jìn)一步的研究來(lái)回答這些問(wèn)題。