VCF文件中GT:AD:DP:GQ:PL的各含義如下:
GT:genotype,表示這個(gè)樣本的基因型,對(duì)于一個(gè)二倍體生物來(lái)說(shuō),GT值表示的是這個(gè)樣本在這個(gè)位點(diǎn)所攜帶的兩個(gè)等位基因的類型,0表示跟REF一樣;1表示跟ALT一樣,0/0表示純合且跟REF一致;0/1表示雜合,兩個(gè)allele一個(gè)是ALT一個(gè)是REF;1/1表示純和且都為ALT;
AD:allele depth,對(duì)應(yīng)兩個(gè)以逗號(hào)隔開(kāi)的值,這兩個(gè)值分別表示覆蓋到REF和ALT堿基的reads數(shù),相當(dāng)于支持REF和支持ALT的測(cè)序深度;
DP:depth of coverage,覆蓋到這個(gè)位點(diǎn)的總的reads數(shù)量,相當(dāng)于這個(gè)位點(diǎn)的深度;
GQ:Quality of the assigned genotype,表示最可能的基因型的質(zhì)量值;
PL:Normalized Phred-scaled likelihoods of the possible genotypes,對(duì)應(yīng)3個(gè)以逗號(hào)隔開(kāi)的值,這三個(gè)值分別表示該位點(diǎn)基因型是0/0,0/1,1/1的沒(méi)經(jīng)過(guò)先驗(yàn)的標(biāo)準(zhǔn)化Phred-scaled似然值(L)。如果轉(zhuǎn)換成支持該基因型概率(P)的話,由于L=-10lgP,那么P=10^(-L/10),當(dāng)L值為0時(shí),P=10^0=1。因此,這個(gè)值越小,支持概率就越大,也就是說(shuō)是這個(gè)基因型的可能性越大。