近日,華中農(nóng)業(yè)大學(xué)動物科技學(xué)院、動物醫(yī)學(xué)院周揚副教授的研究成果在Genome Research雜志作為封面文章發(fā)表。研究構(gòu)建了目前牛泛基因組和基因組結(jié)構(gòu)變異數(shù)據(jù)庫,并對牛的遺傳多樣性和選擇適應(yīng)性提出新見解。
近日,華中農(nóng)業(yè)大學(xué)楊利國教授團隊的周揚副教授與美國農(nóng)業(yè)部George E. Liu團隊合作在Genome Research雜志發(fā)表題為“Assembly of a pangenome for global cattle reveals missing sequences and novel structural variations, providing new insights into their diversity and evolutionary history”的論文,并被選為雜志的封面文章。該文章鑒定出牛參考基因組之外的83Mb新序列,率先從群體水平構(gòu)建了牛泛基因組;同時開發(fā)基因組結(jié)構(gòu)變異(Structural Variation, SV)分析流程,首次從SV的角度解析了世界牛品種的血統(tǒng)關(guān)系,從適應(yīng)性等多角度檢測了不同分類群體的受選擇位點和候選基因,補充了SV作為牛育種材料的不足,并解析SV潛在形成機理促進對?;蚪M演化的深入理解。百邁客為該研究提供了二代測序服務(wù)。

圖1?Genome?Research雜志2022年8月份期刊封面
參考基因組序列是保障一切與基因相關(guān)研究順利實施的必要基礎(chǔ)。2003年長達13年之久的人類參考基因組計劃(85%完整度)為人類解析生命活動開啟了新篇章,被譽為與阿波羅登月計劃和曼哈頓計劃同等重要的大事件。牛參考基因組于2009年發(fā)布,在之后的13年內(nèi)不斷對其進行完善,并相繼公布了近10個牛品種的參考基因組。但每個參考基因組幾乎只包含單個個體基因組序列,忽略了個體之間序列的差異性,導(dǎo)致在科學(xué)研究過程中相當(dāng)一部分基因組序列及其功能處于未知狀態(tài);同時已知基因組序列在不同個體之間存在SV,導(dǎo)致不同個體間基因組序列構(gòu)成非常復(fù)雜,精準(zhǔn)檢測和分型一直是阻止其后續(xù)解析和應(yīng)用的障礙。

圖2泛基因組新序列在已知參考基因組上的分布及影響
為解決以上問題,該文章通過開發(fā)新的基因組分析流程,對來自世界57個品種898頭牛的基因組序列進行組裝和SV檢測;發(fā)現(xiàn)了83Mb的?;蚪M未知序列,相當(dāng)于目前參考基因組序列總長度的3.1%,并且從中鑒定出大量未知外顯子序列,最后綜合三種策略成功將1007條contig放置在現(xiàn)有參考基因組上,這些序列可能通過外顯子破壞、外顯子添加等方式影響了279個基因的序列結(jié)構(gòu)。

圖3利用SV(缺失型變異)對世界牛品種展開精準(zhǔn)群體學(xué)分析
同時,利用多款SV檢測軟件重新開發(fā)新的分析流程,在準(zhǔn)確檢測SV的基礎(chǔ)上實現(xiàn)了對缺失型變異的邊界精準(zhǔn)鑒定和二倍體分型;利用此流程,共檢測到了330萬個缺失變異、12萬個倒置、18萬個重復(fù)區(qū)域,通過對檢測結(jié)果的模擬評估,證明本論文所檢測的SV在牛上已經(jīng)趨于飽和,具有很好的群體代表性。以此為基礎(chǔ),完成了對SV對牛基因組27種不同基因組功能元件和QTL的影響研究,構(gòu)建了受SV影響的基因功能元件數(shù)據(jù)庫。進一步利用缺失型變異對世界牛品種的血統(tǒng)來源進行分析,實現(xiàn)基于SV水平的世界牛品種血統(tǒng)的精準(zhǔn)鑒定,為解析世界牛品種血統(tǒng)組成提供了新方法,打破了長期使用SNP進行遺傳學(xué)分析的局限。
進一步利用比較基因組學(xué)等手段對牛的種屬差異、地域適應(yīng)性、商業(yè)化用途等角度全面解析獲得大量與經(jīng)濟性狀相關(guān)的變異位點,并深入解析了位于APPL2第一外顯子區(qū)域缺失變異與不同地域牛選擇適應(yīng)性之間的關(guān)系;發(fā)現(xiàn)該缺失變異是由Bov-tA1轉(zhuǎn)座子構(gòu)成,并形成了APPL2基因的啟動子和增強子部分,該序列攜帶了APPL2相關(guān)功能的轉(zhuǎn)錄因子結(jié)合位點,通過影響基因的表達,進而調(diào)控與免疫反應(yīng)、味覺功能、細(xì)胞增殖、葡萄糖代謝相關(guān)的功能。
周揚副教授和其碩士研究生楊旅同學(xué)為該論文共同第一作者,George E. Liu、楊利國教授和周揚副教授為共同通訊作者。該研究受到國家自然科學(xué)基金、湖北省自然科學(xué)基金、美國AFRI和NIFA等項目的資助。
如果您對基因組項目有任何技術(shù)問題,歡迎點擊下方按鈕與我們聯(lián)系,我們將免費為您設(shè)計文章研究思路。
A cattle pangenome representation was created based on the genome sequences of 898 cattle representing 57 breeds. The?pangenome identified 83 Mb of sequence not found in the cattle reference genome, representing 3.1% novel sequence compared with the 2.71-Gb reference. A catalog of structural variants developed from this cattle population identified 3.3 million deletions, 0.12 million inversions, and 0.18 million duplications. Estimates of breed ancestry and hybridization between?cattle breeds using insertion/deletions as markers were similar to those produced by single nucleotide polymorphism–based analysis. Hundreds of deletions were observed to have stratification based on subspecies and breed. For example,?an insertion of a Bov-tA1 repeat element was identified in the first intron of the APPL2 gene and correlated with cattle breed?geographic distribution. This insertion falls within a segment overlapping predicted enhancer and promoter regions of the?gene, and could affect important traits such as immune response, olfactory functions, cell proliferation, and glucose metabolism in muscle. The results indicate that pangenomes are a valuable resource for studying diversity and evolutionary history, and help to delineate how domestication, trait-based breeding, and adaptive introgression have shaped the cattle?genome.