三代測序儀以其超長讀長的優(yōu)勢,在基因組組裝中備受青睞,目前廣泛應用的是PacBio三代單分子熒光測序和Nanopore三代單分子納米孔測序,因Nanopore測序讀長更長且通量高的特點,近幾年在基因組組裝應用中嶄露頭角,先后在Nature Biotechnology上發(fā)表了人的基因組、Plant cell上發(fā)表了野生番茄基因組、Nature Genetics上發(fā)表了高粱基因組等等,測序技術已相當成熟。
ONT測序結果展示
作物類(部分)
林木類(部分)
動物(部分)
水產(部分)
中藥材(部分)
注:Species:分析的物種信息;SeqNum:各個長度范圍內序列的數目;SumBase:指各個長度范圍內序列的總長度;N50Len:reads N50長度;N90Len:readsN90長度;MeanLen:平均reads長度;MaxLen:最長reads長度;MeanQual:質量值。
以上是總結的部分作物類、林木類、動物、水產和中藥材的下機數據結果展示,從以上的數據不難看出,平均raeds長度幾乎均在20Kb以上,最長reads高達1.6Mb以上(不同樣品DNA抽提難易程度不同,會造成一定的影響)。
基因組組裝結果展示
上表中最后一列MeanQual就是下機數據的質量值,與堿基準確度的換算公式為:準確度 = 1-10^(-Q/10),經計算? Nanopore下機數據單堿基的平均準確率約為86%左右,這樣經過校正的數據再用Canu、SMARTdenovo、WTDBG等軟件進行基因組的組裝,再經過二代數據的polish之后,堿基的準確度可達到99.99%以上呢!
廢話少說,直接上組裝結果!
植物(部分)
動物(部分)

注:Species:分析的物種信息;CtgNum:contig數目;CtgLen:contig總長度;CtgN50:contigN50長度;CtgN90:contigN90長度;CtgMax:最長contig長度;GC(%):GC含量占比。
注:物種:分析的物種信息;Complete BUSCOs:找到完整基因數;Complete and single-copy BUSCOs:其中單拷貝基因數;Complete and duplicated BUSCOs:多拷貝基因數;Fragmented BUSCOs:預測不完整基因數;Missing BUSCOs:沒有預測出來的基因數。
評估結果顯示基因完整度均在90%以上??!說明Nanopore數據的組裝連續(xù)性和完整性都是非常好的,是值得廣大科研工作者信賴的哦!
百邁客ONT平臺發(fā)展歷程
?

推薦文章