CircSplice軟件可變剪切實(shí)現(xiàn)原理
(1) 通過(guò)STAR比對(duì)至參考基因組序列,得到chimeric reads;
(2) 保留那些比對(duì)上同一染色體和鏈的chimeric reads,通過(guò)CIGAR值判斷reads的坐標(biāo);
(3) 識(shí)別BSJ,去除另一端落在供體和受體位點(diǎn)之外的reads,以確保另一端也來(lái)自circRNA;
(4) 通過(guò)剪切位點(diǎn)GT-AG或者CT-AC對(duì)BSJ進(jìn)行過(guò)濾和識(shí)別;
(5) 對(duì)BSJ進(jìn)行基因注釋;
(6) 將BSJ和其另一端reads比對(duì)到基因的外顯子或內(nèi)含子,結(jié)合基因注釋進(jìn)行4種剪切類型的判斷。允許2bp容錯(cuò)。另外要求代表剪切的read的junction一端坐標(biāo)與注釋外顯子的一端坐標(biāo)一致,以減少假陽(yáng)性預(yù)測(cè);
(7) 通過(guò)GT-AG或CT-AC原則對(duì)可變剪切事件進(jìn)行過(guò)濾;
(8) 計(jì)算可變剪接事件的reads數(shù),并進(jìn)行標(biāo)準(zhǔn)化(支持可變剪切的reads數(shù)*106/總chimeric reads數(shù));
(9) 根據(jù)坐標(biāo)融合不同樣本的剪切事件,比較樣本間的環(huán)狀RNA剪切事件;允許2bp容錯(cuò);
最近文章