无码免费人妻A片AAA毛片西瓜 ,亚洲激情在线观看 http://cysolarrack.com BioMarker Mon, 03 May 2032 15:33:46 +0000 zh-CN hourly 1 https://wordpress.org/?v=4.7.22 http://cysolarrack.com/wp-content/uploads/2020/04/cropped-512-512-32x32.png 生物云 – 百邁客生物 http://cysolarrack.com 32 32 代謝組數(shù)據(jù)預(yù)處理 http://cysolarrack.com/archives/16362 Tue, 16 Apr 2019 09:28:08 +0000 http://cysolarrack.com/?p=16362 在代謝組學(xué)的研究中,進(jìn)行主成分分析、差異分析等之前往往需要先對(duì)數(shù)據(jù)進(jìn)行缺失值填補(bǔ)、標(biāo)準(zhǔn)化等處理,目前處理方法也有很多種,下面將介紹常見(jiàn)的缺失值填補(bǔ)和標(biāo)準(zhǔn)化方法。

對(duì)缺失值的處理,簡(jiǎn)單粗暴的方法是直接去除所有含有缺失的代謝物,對(duì)于一些代謝物如果是在樣本中大量缺失(比如超過(guò)了50%)確實(shí)可以舍棄,而少量缺失如果丟棄則可能會(huì)丟失一些有重要生物學(xué)意義的代謝物,所以對(duì)于少量缺失,較為穩(wěn)妥的辦法就是用值填補(bǔ)。比較簡(jiǎn)單的方法是用0值、均值、中值或最小值的一半進(jìn)行填補(bǔ),復(fù)雜一點(diǎn)的則是使用機(jī)器學(xué)習(xí)的算法如鄰近算法(KNN)、隨機(jī)森林(RF)、奇異值分解(SVD)等方法。由于代謝組目前可分為靶向和非靶向兩大類(lèi)型,在不同的類(lèi)型中往往是采取不同的處理辦法。有研究者認(rèn)為非靶向的推薦使用KNN算法(Do et al.,2018);也有認(rèn)為GC-MS數(shù)據(jù)使用隨機(jī)森林方法(Gromski et al.,2014);還有的則認(rèn)為需要按缺失類(lèi)型,對(duì)于完全非隨機(jī)缺失的可使用最小值的一半進(jìn)行填補(bǔ),完全隨機(jī)缺失或隨機(jī)缺失的使用隨機(jī)森林方法(Wei et al.,2018)。所以目前沒(méi)有統(tǒng)一的標(biāo)準(zhǔn)。

標(biāo)準(zhǔn)化主要是為了去除實(shí)驗(yàn)、技術(shù)等帶來(lái)的誤差,常見(jiàn)的方法有:內(nèi)標(biāo),即代謝物除以?xún)?nèi)標(biāo)豐度,可用于GC-MS;總峰面積標(biāo)準(zhǔn)化,即代謝物除以所有代謝物的總峰面積,可用于非靶向LC-MS;對(duì)數(shù)變換即直接對(duì)豐度取對(duì)數(shù),LC-MS和GC-MS都有用到;PQN (Probabilistic Quotient Normalization)即每個(gè)代謝物除以了一個(gè)稀釋因子,這個(gè)因子則是依賴(lài)于樣本與參考樣本比值的分布,在NMR分析中被認(rèn)為是一種穩(wěn)健的方法;此外還有均值標(biāo)準(zhǔn)化、分位數(shù)標(biāo)準(zhǔn)化、中值標(biāo)準(zhǔn)化、z-score標(biāo)準(zhǔn)化等(Li et al.,2017),這些方法也可以結(jié)合使用(Di et al.,2016)。不同方法可能會(huì)引起不同分析目的的差異,比如進(jìn)行差異分析的時(shí)候,使用分位數(shù)方法可能比PQN方法好,而在進(jìn)行代謝標(biāo)志物篩選時(shí),則表現(xiàn)差不多(Li et al.,2017)。因此,在分析的時(shí)候也可多嘗試一些標(biāo)準(zhǔn)化的方法。

總的來(lái)說(shuō),缺失值和標(biāo)準(zhǔn)化的處理方法目前并無(wú)完全統(tǒng)一的標(biāo)準(zhǔn),需要結(jié)合具體的實(shí)驗(yàn)方法、目的進(jìn)行多次的調(diào)試以達(dá)到所期望的目標(biāo)。目前,百邁客云上的代謝組分析平臺(tái)已包含上述部分處理方法,操作簡(jiǎn)單,分析速度快,后續(xù)也會(huì)不斷增加更多的處理方式以滿(mǎn)足不同需求。

 

參考文獻(xiàn):

[1]?Do K T, Wahl S, Raffler J, et al. Characterization of missing values in untargeted MS-based metabolomics data and evaluation of missing data handling strategies[J]. Metabolomics, 2018, 14(10): 128.

[2] Gromski P, Xu Y, Kotze H, et al. Influence of missing values substitutes on multivariate analysis of metabolomics data[J]. Metabolites, 2014, 4(2): 433-452.

[3] Wei R, Wang J, Su M, et al. Missing value imputation approach for mass spectrometry-based metabolomics data[J]. Scientific reports, 2018, 8(1): 663.

[4]?Di Guida R, Engel J, Allwood J W, et al. Non-targeted UHPLC-MS metabolomic data processing methods: a comparative investigation of normalisation, missing value imputation, transformation and scaling[J]. Metabolomics, 2016, 12(5): 93.

[5]?Li B, Tang J, Yang Q, et al. NOREVA: normalization and evaluation of MS-based metabolomics data[J]. Nucleic acids research, 2017, 45(W1): W162-W170.

]]>
五色丁香色情在线观看网站 | 在线免费黄色视频 | 国产精品a久久久久久久 | av中文字幕在线观看 | 爱爱动态图免费120秒 | 国产伦子伦一级A片免费看小说 | 无码 精品 国产19 | 精品国产美女裸身无遮挡AV上网站 | 免费在线观看午夜福利 | 欧美精品人爱A欧美精品 | 近親相姦中出し親子在线 | 精品人妻无码一区二区三区古桃屋 | 少妇精品一品二品三品在线观看 | 91睡熟迷奷系列精品 | 熟女人妻精品一二三四 | 人妻少妇被粗大爽中文视频 | 白丝女疯狂 喷水自慰爽 | 搡BBB搡BBBB搡BBBB电影 | av无码一区二区三区 | AV午夜久久蜜桃传媒软件 | 成人天堂一级婬片A片AAA软件 | 一级A片色情大片视频我和少妇 | 午夜拍拍拍拍拍拍拍拍拍拍拍 | 国产无套丰满白嫩对白 | 久久久国产精品一区二区白洁老师 | 亚洲无码软件导航影音先锋 | 中文简体视频人妻 | 玩弄丰满少妇高潮A片91 | 91.www在线观看 | 调教丝袜在线观看91 | 91秘 片黄在线观看 变态调教一区二区三区 | 爆乳少妇无码a在线观看 | 国内精品久久久久无码 | 亚洲一区在线免费观看 | 羞羞的喷水自慰欧美片 | 黄色视频在线免费观看视频 | 人妻少妇偷人精品久久人妻 | 寡妇高潮A片免费播放 | 中文字幕乱码人妻无码久久竹菊 | 国偷自拍AV一区二区三区在线 | 无码一区二区三区四区 |