酵母以其易于基因改良且生長迅速的特點,成為學術研究和工業(yè)生產的利器。近些年,隨著測序技術的發(fā)展,更是晉升為三代測序技術的團寵。2017年發(fā)表在Genome Research(IF=10.101)上的“The dynamic landscape of fission yeast meiosis alternative-splice isoforms”(請點擊閱讀原文下載)在學術圈廣為流傳,是利用 PacBio 研究可變剪接的經典案例。
今年酵母搭乘 Nanopore 再發(fā)2篇高分文章(請點擊下載原文),從基因組、轉錄組體驗長片段測序的利好。
Nanopore 測序到底怎么樣?可以做定量嗎?和 PacBio 相比如何?
這篇“Complete genomic and transcriptional landscape analysis using third-generation sequencing: a case study of Saccharomyces cerevisiae CEN.PK113-7D”告訴您?。?a >請點擊下載原文)
時間:2018 年 4 月
雜志:Nucleic Acids Research
影響因子:11.561
材料和方法
樣品:酵母菌種 CEN.PK113-7D
測序方案:
? 全基因組測序:
? PacBio,Sequel,~4900Mb,N50為8700bp,約408X(PRJNA398797,SRP116559)
? Nanopore,MinIon,~830Mb,N50 為 12500bp,約 69X(PRJNA398797, SRP116559)
? Illumina,HiSeq 2000,先前研究序列(SRS307298)
? 全長轉錄組測序:
? Nanopore,MinIon,direct RNA,葡萄糖生長條件和乙醇生長條件,各 4 個 生物 學重復(PRJNA398797, SRP116559 )
? Illumina,HiSeq 2000,先前研究序列(SRS307298)
主要結果
1、基因組數據特征分析
相比于 PacBio,MinIon 能產出更長的序列,但是 PacBio 測到的序列數量是 MinIon 的 5.6 倍左右。大部分的序列在兩個平臺都能檢測到,個別特有的序列可能和實驗階段的片段篩選有關。
圖 1 MinIon and PacBio 數據特征統(tǒng)計
對于不同測序平臺得到的基因組數據,采用 3 種組裝方式:只用 MinIon 得到的數據進行 de nove組裝得到 ONT_assembly;只用 PacBio 得到的數據進行 組裝得到 PacBio_assembly;用 MinIon和 PacBio 得到的數據共同進行 de nove 組裝得到 OP_assembly。然后使用 Illumina 的數據對組裝結 果進行校正。三種組裝方式得到的 2μm 質粒都比已知的 S288C 酵母的 2μm 質粒更長,而ONT_assembly 的組裝結果很好,剛好組裝出 16 條染色體,1個線粒體序列,1個質粒序列;PacBio_assembly 組裝的線粒體序列是斷裂開的兩段;OP_assembly 組裝出的 contigs 最多,多出 3個端粒 DNA 片段,2 個質粒片段,而且組裝時把 VII 染色體和 XIII 染色體的端粒區(qū)域連接在了一 起。 總體來看,三種組裝方式得到的基因組很相近,由于 OP_assembly 的測序深度最高,與 S288C酵母的平均比對率達到了 99.6%。
表 1 三種組裝方式的數據比較
2、全長轉錄組數據特征分析
二次生長(diauxic growth)是指微生物可以利用一種營養(yǎng)物質產生代謝產物,當原始營養(yǎng) 物質被利用完后,可以進一步利用其代謝產物生長繁殖,產生新的代謝產物。最典型的二次生長 現象就是酵母菌的二次生長,即在糖源豐富時,酵母將葡萄糖糖轉化為乙醇,當葡萄糖耗盡后, 酵母可以進一步將乙醇氧化為乙酸,維持生長。
分別對葡萄糖條件和乙醇條件下生長的酵母進行全長轉錄組測序,葡萄糖生長條件下的酵母 共計獲得~509 MB(59X)數據量,包含約 530,000 高質量 reads,其中 N50 為 1150bp;乙醇條 件下的酵母共計獲得~623 MB(72X)數據,約 623000 高質量 reads,其中 N50 為 1263 bp。該 技術的比對率為 88%,錯誤率為 12%,其中超過 70%的轉錄本為全長轉錄本,鑒定長度最長轉錄 本超過 5kb。全長轉錄本的比例隨著轉錄本長度增加而減小,與轉錄本的表達量沒有明顯關系。有22 個轉錄本是明顯高表達的,比如 豐度最高的轉錄本之一, 的同源 基因,在兩個培養(yǎng)條件下表達量都很高;在乙醇條件下特異高表達一些與熱休克蛋白、氧化脅迫 相關的基因,其中 編碼檸檬酸合酶,說明此時激活了乙醛酸途徑;在葡萄糖培養(yǎng)條件下,與 有氧呼吸、核糖體相關的基因表達量較高,符合此條件下酵母生長更快的特征。
圖 2 轉錄組數據特征統(tǒng)計
3、全長轉錄組數據差異篩選
通過主成份分析(PCA)發(fā)現兩組數據有明顯的差異,PC1 的貢獻率達到 90%。使用 DESeq2做差異分析并對差異基因做 GO 富集分析,結果顯示葡萄糖培養(yǎng)條件下的上調基因富集到了與轉 錄、翻譯過程相關的 GO term,與葡萄糖培養(yǎng)條件下生長更快的表型吻合。在乙醇培養(yǎng)條件下, 上調基因主要富集到了 TCA 循環(huán),乙醛酸通路,線粒體電子傳遞方面。同時,由于營養(yǎng)物質消耗、 毒性代謝物積累,在乙醇條件下很多與脅迫響應,分解代謝,β氧化相關的基因表達量上調。
4、轉錄組:MinION VS Illumina
由于 Illumina 產出的是短片段,比對上基因組的 reads 數比 MinION 要多 10 倍左右。比對上的堿基總數可以反映測序深度,統(tǒng)計發(fā)現 MinION 約有 0.5G 數據,測序深度 64X,Illumina 約有1G 數據,測序深度 118X。(圖 3E)而在平均覆蓋率的統(tǒng)計中發(fā)現,兩種平臺非常相似。(圖 3F) 可見,在相似的覆蓋率需求下,MinION 需要的數據量更少。
圖 3 轉錄組差異分析
5、轉錄組數據結構分析
MinION 的數據中,我們發(fā)現相鄰的 2 個基因 PTH1 (CENPK0H0281W) 和 ERG9 (CENPK0H0282W) 轉錄在一個轉錄本中,有大量的 reads 跨越了基因間區(qū)。而 Illumina 的比對結果中, 在兩個 ORFs 之間的區(qū)域,比對到的 reads 不是完全覆蓋的,這種低置信度的信息很可能被忽略。
圖 4 THI1 和 ERG9 比對結果可視化
總結
本文將第三代測序技術與成熟的生物信息學分析流程結合起來,成功組裝出真核生物的基因組。長片段測序使高質量、完整的真核基因組序列的重新組裝成為可能,這為比較基因組學奠定了堅實的基礎。Nanopore 測序能夠準確測定編碼的 mRNA 位置,基因表達量,以及轉錄本的結構。我們相信,Nanopore 測序將成為未來基因組和轉錄組重要方式。應該注意的是,本文研究的是基因組簡單的酵母,在處理高等生物(動物和植物)的基因組和轉錄組時,需要更高的測序深度和更長的讀取。
今年8月份牛津納米孔公司與百邁客公司達成長期合作,已引入Oxford Nanopore平臺,擁 有 MinION、GridION X5 和 PromethION 三種型號全套納米孔測序儀。
在這盛世華誕來臨之際
我們給科研大咖奉上鉅惠大禮!??!
想嘗試新技術!
想快速發(fā)文章!
想發(fā)高分文章!
請聯系我們免費獲取文章思路設計方案!