隨著單細胞技術的普及與應用,實驗流程中的質控標準、Cell Ranger和Seurat等軟件的分析內容,已不再是單細胞小白的困擾,目前單細胞測序的難點在于獲取測序數據后,基于標準分析結果如何進行后續(xù)的數據挖掘,進一步解釋生物學現(xiàn)象。
單細胞測序數據挖掘方向
數據處理? | 細胞分群注釋? | 差異分析? | 功能分析? | 細胞通訊分析? |
|
|
|
|
|
發(fā)育軌跡分析? | 轉錄調控分析? | 腫瘤異質性分析? | 臨床相關性分析? | 單細胞聯(lián)合空間? |
|
|
|
|
|
單細胞測序數據個性化分析方法
單細胞測序數據的挖掘方向復雜多樣,針對不同領域的生物學表型和機理研究,需要持續(xù)不斷地開發(fā)個性化分析內容,從不同的角度進行個性化數據挖掘,以下就是單細胞測序數據個性化分析的幾個分析方向:
1、單細胞測序個性化分析方法:細胞軌跡分析–揭示細胞發(fā)育分化動態(tài)軌跡
細胞軌跡分析可以在單細胞分辨率驗證已知的細胞分化關系,推斷未知的細胞分化路徑,挖掘一些稀少的中間狀態(tài)細胞,解析細胞分化過程中的起調控作用的關鍵基因,在發(fā)育生物學中細胞分化、譜系發(fā)育研究方向、腫瘤/疾病微環(huán)境中免疫細胞的動態(tài)變化研究中均有廣泛應用。目前進行細胞軌跡分析的方法和軟件非常之多,大致可以概括為兩種方法,一種是以monocle軟件為代表的擬時序分析(pseudotime analysis),另一種則是以velocyto /scVelo為主的RNA速度分析(RNA velocity)。詳情>>單細胞數據分析沒有思路?試試細胞軌跡分析~(內附代碼)
2、單細胞測序個性化分析方法:細胞通訊分析–解析細胞間的信號通訊關系
多細胞生物是由很多不同類型細胞組成的開放而復雜體系,配體受體復合物介導的細胞間通訊對協(xié)調發(fā)育、分化和炎癥等多種生物學過程至關重要。細胞通訊分析,又稱細胞受體-配體互作分析,是以細胞亞群的基因表達量數據為研究對象,通過獲得細胞中配體及受體基因的表達信息,比較細胞類型之間的配體與受體基因表達差異,分析得到細胞亞群間的信號通訊關系,在闡明生物學過程中細胞間通訊的復雜性、多樣性和動態(tài)性方面有重要意義。
3、單細胞測序個性化分析方法:GSEA/GSVA分析–基于功能基因集的富集分析策略
GSEA( Gene Set Enrichment Analysis),是2005年由Broad Institute研究開發(fā)的一種基于基因集的富集分析方法,用來評估一個預先定義的基因集的基因在與表型相關度排序的基因表中的分布趨勢,從而判斷其對表型的貢獻。GSEA是從所有基因的表達豐度出發(fā),分析在不同的通路中的基因的整體表達影響,這也是區(qū)別于GO/KEGG富集分析的地方,GSEA不需要設定差異閾值篩選目標基因集,理論上更容易囊括細微但協(xié)調性的變化對生物通路的影響。Broad研究所在GSEA發(fā)布8年之后,開發(fā)了GSVA(Gene Set Variation Analysis)算法來拓展基因集分析的應用。GSEA分析主要用于兩兩組間比較的方案設計中,對于分組比較復雜的方案設計則比較適合GSVA分析,GSVA不需要預先進行樣本之間的差異分析,依據表達矩陣就可以計算每個樣本中特定基因集的變異分數。
4、單細胞測序個性化分析方法:腫瘤拷貝數變異分析–揭示惡性細胞表型
拷貝數變異(Copy number variation, CNV)是由基因組發(fā)生重排而導致的,基因組大片段的拷貝數增加或者減少,基因組結構變異(Structural variation, SV) 的重要組成部分,也是人類疾病的重要致病因素之一。與正常細胞相比,腫瘤基因組部分區(qū)域呈現(xiàn)過表達或低表達狀態(tài),通過與一組參考的“正?!奔毎啾?,比較不同樣本間或不同細胞類型之間的CNV基因表達差異,探索腫瘤基因組位置上基因的表達強度,最終反映基因大片段區(qū)域的CNV事件,鑒定體細胞整個染色體或大片段染色體的擴增或缺失。
5、單細胞測序個性化分析方法:轉錄因子活性分析–挖掘關鍵調控轉錄因子
單細胞研究通常會涉及到一個核心關鍵問題:細胞的異質性以及這種異質性是如何發(fā)展和維持的。這種細胞異質性很大程度上是由潛在的基因調控網絡決定的,特定轉錄因子(transcription factor,TF)集合的協(xié)同表達驅動各自靶標基因的表達,從而建立特定的基因表達譜。因此,單細胞的基因調控網絡對于深入挖掘細胞異質性背后的生物學意義是至關重要的。利用pySCENIC從單細胞轉錄組數據中推斷TF、基因調控網絡和細胞類型,基本原理是基于共表達和DNA調控保守序列(motif)分析推斷基因調控網絡,然后在每個細胞中分析網絡活性以鑒定細胞狀態(tài)。
6:、單細胞測序個性化分析方法:加權基因共表達網絡分析–篩選表型相關核心調控網絡
加權基因共表達網絡分析(Weighted Gene Co-expression Network Analysis, WGCNA)是構建基因共表達網絡的常用方法,可以探索模塊與特定表型或疾病的關聯(lián)關系,最終達到鑒定基因網絡的目的;單細胞測序技術可以揭示特定腫瘤組織中的細胞特異性,對細胞進行分類,并且識別特定的標志物,但其檢測的細胞數量和病例來源都是有限的。利用WGCNA分析單細胞轉錄組測序數據,可以提供一套有別于高変基因、差異分析的方法,不依賴于數據庫直接用表達量的相關性值預測調控關系,篩選某些細胞亞群中有關聯(lián)作用的基因集(稱為模塊),可以從成千上萬的基因中挑選出高度相關的基因的模塊,并將模塊與表型進行關聯(lián),尋找marker gene或治療靶點。
7、單細胞測序個性化分析方法:單細胞空間聯(lián)合分析-解析空間結構異質性
基因表達具有時間和空間特異性,單細胞轉錄組主要從時間上研究基因表達,能夠系統(tǒng)的識別組織中的細胞亞群,但沒有捕獲其空間組織信息,限制了我們對組織及細胞間相互作用的理解。而空間轉錄組的應用使得人們能夠從空間的角度解析數據,在空間上研究基因的表達。通過整合兩種數據模式,將單細胞轉錄組數據和空間轉錄組數據進行聯(lián)合分析,在時空上分析基因的表達具有重要的意義。
如果您對以上個性化分析方案感興趣,歡迎點擊下方按鈕聯(lián)系我們,我們將免費為您設計文章思路文章。