安裝monocle 包
monocle 分析之?dāng)?shù)據(jù)導(dǎo)入
monocle 分析之細(xì)胞聚類(lèi)
數(shù)據(jù)預(yù)處理降維、可視化
去批次效應(yīng)后重新降維
monocle3可以分析大型、復(fù)雜的單細(xì)胞數(shù)據(jù),可處理數(shù)百萬(wàn)個(gè)細(xì)胞。monocle3主要更新了哪些功能?
1.一個(gè)更好的結(jié)構(gòu)化工作流程來(lái)學(xué)習(xí)發(fā)展軌跡。
2.支持 UMAP 算法初始化軌跡推斷。
3.支持具有多個(gè)root的軌跡。
4.學(xué)習(xí)具有循環(huán)或收斂點(diǎn)的軌跡的方法(Ways to learn trajectories that have loops or points of convergence)。
5.利用“近似圖抽象”的思想,?動(dòng)劃分細(xì)胞以學(xué)習(xí)不相交或平?軌跡的算法。
6.一種新的對(duì)軌跡依賴(lài)表達(dá)的基因的統(tǒng)計(jì)測(cè)試。這將替換舊的differalgenetest()函數(shù)和BEAM()。
7.3D界面可視化軌跡和基因表達(dá)。
安裝monocle3包
要求R > 3.6.1
1、安裝Bioconductor
1 if (!requireNamespace(“BiocManager”, quietly = TRUE))
2 install.packages(“BiocManager”)
3 BiocManager::install(version = “3.10”)
2、安裝依賴(lài)包
1 BiocManager::install(c(‘BiocGenerics’, ‘DelayedArray’, ‘DelayedMatrixStats’,
2 ‘limma’, ‘S4Vectors’, ‘SingleCellExperiment’,
3 ‘SummarizedExperiment’, ‘batchelor’, ‘Matrix.utils’))
3、安裝monocle3
1 install.packages(“devtools”)
2 devtools::install_github(‘cole-trapnell-lab/leidenbase’)
3 devtools::install_github(‘cole-trapnell-lab/monocle3’)
如果不能聯(lián)網(wǎng)下載,可以下載到本地然后本地安裝
1 library(devtools)
2 install_local(“D:/monocle3-0.2.2.tar.gz”)
monocle3分析之?dāng)?shù)據(jù)導(dǎo)入
1、從seurat對(duì)象生成 cell_data_set (CDS)對(duì)象
.expression_matrix , a numeric matrix of expression values, where rows are genes, and columns are cells
.cell_metadata , a data frame, where rows are cells, and columns are cell attributes (such as cell type, culture condition, day captured, etc.)
.gene_metadata , an data frame, where rows are features (e.g. genes), and columns are gene attributes, such as biotype, gc content, etc.
注:表達(dá)矩陣的?數(shù)必須與gene_metadata相同,表達(dá)矩陣的列必須與cell_metadata相同
1?library(monocle3)
2?sceObj?<-?readRDS(“/path/sce_test.Rds”)
3?expression?<-?GetAssayData(sceObj,?assay?=?‘RNA’,?slot?=?‘counts’)
4?cell_metadata?<-?sceObj@meta.data
5?gene_annotation?<-?data.frame(gene_short_name?=?rownames(expression))
6?rownames(gene_annotation)?<-?rownames(expression)
7?monocle_cds?<-?new_cell_data_set(expression,?cell_metadata?=?cell_metadata,?gene_metadata?=?gene_annotation)
2、直接從10X cellranger生成CDS對(duì)象
monocle_cds 注:也可以使? load_mm_data() 函數(shù)讀取 MatrixMarket 格式數(shù)據(jù)
monocle3分析之細(xì)胞聚類(lèi)
我們使用monocle3對(duì)數(shù)據(jù)進(jìn)行聚類(lèi)分析。
數(shù)據(jù)預(yù)處理
使用 preprocess_cds 對(duì)數(shù)據(jù)進(jìn)行normalize 以及 PCA 降維
monocle_cds?<-?preprocess_cds(monocle_cds,?num_dim?=?50)
注:可以使? plot_pc_variance_explained() 函數(shù)畫(huà)肘部圖,從中選擇合適的 PCs 數(shù)降維、可視化
1?monocle_cds?<-?reduce_dimension(monocle_cds,?preprocess_method?=?“PCA”)?#?默認(rèn)使?UMAP
2?plot_cells(monocle_cds,?color_cells_by=”seurat_clusters”)?#?umap顯示原seurat?細(xì)胞聚類(lèi)的結(jié)果
?plot_cells(monocle_cds, genes=c(“LTB”, “IL7R”)) # 顯示某幾個(gè)基因的表達(dá)
去批次效應(yīng)后重新降維
檢查樣本間批次效應(yīng)
plot_cells(monocle_cds, color_cells_by=”sample”, label_cell_groups=FALSE) # 檢查樣本間的批次效應(yīng)
align_cds移除批次效應(yīng)
1?#?align_cds()?tries?to?remove?batch?effects?using?mutual?nearest?neighbor?alignment
2?monocle_cds?<-?align_cds(monocle_cds,?num_dim?=?100,?alignment_group?=?“sample”)?#?去除批次效應(yīng),似乎不太好使
3?monocle_cds?<-?reduce_dimension(monocle_cds)
plot_cells(monocle_cds,?color_cells_by=”sample”,?label_cell_groups=FALSE)
細(xì)胞聚類(lèi)
1?#?monocle3同樣可以指定resolution(默認(rèn)NULL),但需要注意,resolution?設(shè)置??seurat?很多(例如當(dāng)resolution=0.1時(shí),出現(xiàn)?百個(gè)cluster)
2?monocle_cds?<-?cluster_cells(monocle_cds,?resolution?=?0.0001,?reduction_method?=?“umap”)
3?plot_cells(monocle_cds)
Marker 基因分析
使用 top_markers() 函數(shù)尋找cluster之間的marker基因。
1# 可以選擇 cluster 也可以選擇 partitions
2as.character(partitions(monocle_cds)) %>% unique
3 [1] “3” “2” “6” “11” “4” “7” “1” “5” “9” “10” “8”
4 as.character(clusters(monocle_cds)) %>% unique
5 [1] “8” “4” “10” “14” “19” “9” “15” “2” “7” “1” “6” “5” “13” “11”
“17”
6 [16] “3” “12” “18” “16”
7
8marker_test_res 9head(marker_test_res, n = 3)
10gene_id gene_short_name cell_group marker_score mean_expression 11 1 HES4 HES4 10 0.2511486 0.9178898
12 2 TNFRSF18 TNFRSF18 3 0.2701016 3.8953993
13 3 TNFRSF4 TNFRSF4 3 0.3305234 5.8852331
14 fraction_expressing specificity pseudo_R2 marker_test_p_value 15 1 0.6170213 0.4070340 0.3236830 4.873175e-105 16 2 0.7234243 0.3733654 0.2931210 9.156877e-159 17 3 0.7102540 0.4653594 0.3062058 5.322088e-166
18 marker_test_q_value 19 1 1.317746e-99
20 2 2.476093e-153
21 3 1.439135e-160
22marker_test_res 23top_specific_markers %
24filter(fraction_expressing >= 0.10) %>%
25group_by(cell_group) %>%
26top_n(1, pseudo_R2)
27top_specific_marker_ids % pull(gene_id))
28plot_genes_by_group(monocle_cds,
29top_specific_marker_ids,
30group_cells_by=”cluster”,
31ordering_type=”maximal_on_diag”,
max.size=3
1?#?將monocle3結(jié)果存到seurat對(duì)象中
2?colData(monocle_cds)$monocle3_partitions?<-?as.character(partitions(monocle_cds))
3?colData(monocle_cds)$monocle3_clusters?<-?as.character(clusters(monocle_cds))
4?sceObj@meta.data?<-?pData(monocle_cds)?%>%?as.data.frame
百邁客不僅提供標(biāo)準(zhǔn)分析內(nèi)容,還提供個(gè)性化分析內(nèi)容,全新的monocle3 數(shù)據(jù)分析,詳情可見(jiàn)單細(xì)胞轉(zhuǎn)錄組分析難?教您2步,輕松玩轉(zhuǎn)它。更多好玩的,生信分析內(nèi)容盡在百邁客云平臺(tái),如果感興趣歡迎點(diǎn)擊按鈕聯(lián)系我們,我們將免費(fèi)為您設(shè)計(jì)文章思路分析方案。
推薦閱讀:
SPOTlight助力單細(xì)胞和空間轉(zhuǎn)錄組聯(lián)合分析
Cell | 單細(xì)胞+空間轉(zhuǎn)錄組解析人類(lèi)腸道發(fā)育的時(shí)空密碼
百邁客:10x單細(xì)胞轉(zhuǎn)錄組與空間轉(zhuǎn)錄組聯(lián)合分析一睹為快
空間轉(zhuǎn)錄組ST & 單細(xì)胞轉(zhuǎn)錄組測(cè)序聯(lián)合揭示胰腺導(dǎo)管腺癌的組織結(jié)構(gòu)
Nature |?單細(xì)胞和空間轉(zhuǎn)錄組揭示類(lèi)原腸胚中的體節(jié)發(fā)生
單細(xì)胞轉(zhuǎn)錄組+空間轉(zhuǎn)錄組聯(lián)合繪制人類(lèi)鱗狀細(xì)胞癌組成和空間結(jié)構(gòu)的多模式圖譜
單細(xì)胞轉(zhuǎn)錄組+空間轉(zhuǎn)錄組揭示人類(lèi)心臟發(fā)育過(guò)程中整個(gè)器官的空間基因表達(dá)和細(xì)胞圖譜
單細(xì)胞轉(zhuǎn)錄組分析難?教您2步,輕松玩轉(zhuǎn)它