生物信息和科技服務(wù)行業(yè)正在經(jīng)歷從1.0時(shí)代向2.0時(shí)代的變遷。在這個(gè)變遷的浪潮下,生物科研工作者,科技服務(wù)從業(yè)人員都面臨著哪些挑戰(zhàn)和機(jī)遇?從業(yè)十五年的百邁客CEO鄭洪坤認(rèn)為:云模式,才是打開(kāi)基因科技服務(wù)2.0時(shí)代的正確方式。
基因科技服務(wù)1.0時(shí)代:測(cè)序數(shù)據(jù)少,分析以標(biāo)準(zhǔn)分析為主且主要由服務(wù)公司完成
我很有幸一入行就進(jìn)入了生物信息行業(yè),到現(xiàn)在算起來(lái)也有15年了。這些年見(jiàn)證了生物信息和科技服務(wù)行業(yè)的發(fā)展??萍挤?wù)在一代測(cè)序時(shí)代就存在,爆發(fā)式發(fā)展是從二代測(cè)序開(kāi)始之后,隨著二代測(cè)序進(jìn)入市場(chǎng),測(cè)序價(jià)格大幅下降,二代測(cè)序被更多的科研工作者應(yīng)用??萍挤?wù)的模式的初期,由于測(cè)序數(shù)據(jù)少,科學(xué)家們選擇一些有特點(diǎn)的物種、品種或者性狀進(jìn)行測(cè)序,數(shù)據(jù)稍加分析就可以得到讓科研工作者為之興奮的結(jié)果,科研的創(chuàng)新度較高,發(fā)文章的概率也高,因此大大激發(fā)了科研人員用測(cè)序技術(shù)做研究的熱情。這個(gè)測(cè)序數(shù)據(jù)較少,分析要求不高且分析工作單純的由服務(wù)公司來(lái)做的階段可以定義為“科技服務(wù)1.0時(shí)代”。
?
基因科技服務(wù)2.0時(shí)代:PB級(jí)公共數(shù)據(jù)、云端可視化自主分析的基因大數(shù)據(jù)挖掘時(shí)代
隨著技術(shù)的不斷發(fā)展,測(cè)序成本越來(lái)越低,數(shù)據(jù)也越測(cè)越多,已經(jīng)提交到NCBI SRA數(shù)據(jù)庫(kù)的數(shù)據(jù)就已經(jīng)達(dá)到12P以上。特別是人、水稻、小鼠、玉米、豬、牛、大豆等一些重要物種數(shù)據(jù)積累的數(shù)量巨大,而且持續(xù)保持著高速增長(zhǎng)。其中蘊(yùn)含的巨大價(jià)值也開(kāi)始引起廣大科研工作者的興趣,同時(shí)科技服務(wù)1.0模式中的數(shù)據(jù)挖掘程度已經(jīng)不能滿足科研的需求,科學(xué)家對(duì)數(shù)據(jù)做更深入挖掘的需求越來(lái)越高,需要更多探索性的、個(gè)性化的分析,以從眾多同質(zhì)化的科研項(xiàng)目中脫穎而出。
圖1.公共數(shù)據(jù)逐年增長(zhǎng)情況
?
圖2.Top10公共數(shù)據(jù)分類(單位:Tbases)
數(shù)據(jù)分析要求變高,對(duì)科技服務(wù)類公司無(wú)疑是個(gè)大的挑戰(zhàn)。首先,對(duì)科研數(shù)據(jù)的深入挖掘往往涉及到更深層次的科學(xué)問(wèn)題,個(gè)性化程度極強(qiáng),這就要求生物信息人員不但要掌握生信專業(yè)知識(shí)和技能,還有有相對(duì)豐富的生物學(xué)知識(shí),才能真正理解科學(xué)家的需求,對(duì)服務(wù)人員的要求大大提高;其次,由于科研工作本身探索的就是未知領(lǐng)域,存在相當(dāng)?shù)牟淮_定性,數(shù)據(jù)分析的結(jié)果不一定和科學(xué)家最初的科研設(shè)計(jì)一致,會(huì)導(dǎo)致科學(xué)家對(duì)服務(wù)公司的滿意度不高。因此科研工作者開(kāi)始不斷的換公司進(jìn)行嘗試,隨著小公司的不斷涌現(xiàn),稂莠不齊,科技服務(wù)市場(chǎng)也越來(lái)越混亂。數(shù)據(jù)分析同質(zhì)化嚴(yán)重,數(shù)據(jù)深入挖掘程度不足,溝通效率低,分析成本高等開(kāi)始制約科技服務(wù)行業(yè)的發(fā)展。因此必須通過(guò)變革,用一種新的更高效的模式來(lái)逐步優(yōu)化現(xiàn)有的科技服務(wù)模式。
因此很多人都想到搭建生物云平臺(tái),在云端放上需要的軟件,放上需要的數(shù)據(jù),讓科研工作者可以自己去分析,可以根據(jù)自己的需求去做深入數(shù)據(jù)挖掘,提高科研效率。有不少公司開(kāi)發(fā)了生物云平臺(tái),但是能被科研工作者所廣泛應(yīng)用卻不是一個(gè)容易的事情。
適合生物科研工作者的云平臺(tái)必需具備以下四點(diǎn)要求:首先,需要對(duì)客戶數(shù)據(jù)分析需求有深入的了解,這就需要有非常豐富的的分析經(jīng)驗(yàn),并且可以在現(xiàn)有科技服務(wù)模式上不斷提煉客戶新的需求;其次,要保障所用軟件數(shù)據(jù)準(zhǔn)確性,就需要豐富的實(shí)踐經(jīng)驗(yàn),需要有多年、成千上萬(wàn)項(xiàng)目的積累;再次,要讓生物信息開(kāi)發(fā)和IT開(kāi)發(fā)“兩手抓,兩手都要硬”,即要保證云計(jì)算底層架構(gòu)是符合基因大數(shù)據(jù)研究的需要,也要保障生物信息軟件符合IT開(kāi)發(fā)的高要求,可視化并簡(jiǎn)單易用的;最后,要有符合當(dāng)前客戶特點(diǎn)的培訓(xùn)體系,讓客戶能快速上手操作,在平臺(tái)上能夠很容易找到實(shí)現(xiàn)自己需求的分析工具和數(shù)據(jù)。
如此“高配”的要求,正是導(dǎo)致之前開(kāi)發(fā)的一些云平臺(tái)不能為科研工作者所用的真正原因。這些平臺(tái),要么里面只有標(biāo)準(zhǔn)化流程,客戶想要解決的深入挖掘問(wèn)題不能實(shí)現(xiàn),要么只是各種軟件疊加上去,客戶看著無(wú)從下手;又或者只是在云計(jì)算的底層做了大量開(kāi)發(fā),而應(yīng)用層開(kāi)發(fā)不到位,導(dǎo)致客戶根本不會(huì)用。
“百邁客云”使以上問(wèn)題得到破解。百邁客8年的科技服務(wù)經(jīng)驗(yàn)中提煉出的客戶需求,數(shù)以萬(wàn)計(jì)的項(xiàng)目分析經(jīng)驗(yàn)保證了分析的準(zhǔn)確性,生物信息人才和計(jì)算機(jī)人才團(tuán)隊(duì)的超融合,多年生物信息培訓(xùn)班等知識(shí)傳播經(jīng)驗(yàn)為百邁客云平臺(tái)的開(kāi)發(fā)和應(yīng)用提供了有力的保障。從而使云平臺(tái)能夠更好的滿足客戶數(shù)據(jù)深入挖掘的需求,能夠在科研工作者中廣泛推廣和輕松使用。這種模式讓我們的研究人員有更多的精力去把握科學(xué)技術(shù)前沿發(fā)展,設(shè)計(jì)科研的思路,不用擔(dān)心生物信息和IT的技術(shù)問(wèn)題,真正實(shí)現(xiàn)了我們一直以來(lái)希望的客戶通過(guò)云平臺(tái)自己做分析,相比科技服務(wù)1.0模式是一個(gè)顛覆性的變革,“授人以魚不如授人以漁”,這種可以讓生物學(xué)家在云端對(duì)自有數(shù)據(jù)結(jié)合PB級(jí)公共數(shù)據(jù)自主進(jìn)行可視化、交互式基因大數(shù)據(jù)挖掘的科技服務(wù)模式我把它定義為“科技服務(wù) 2.0 時(shí)代”。
百邁客云,讓每個(gè)課題組都輕松具備生信分析能力,引領(lǐng)基因科技服務(wù)2.0時(shí)代
圖3.基因科技服務(wù)2.0時(shí)代
百邁客云提供了“云服務(wù)”和“云賬號(hào)”兩種模式。 “云服務(wù)”是測(cè)序分析的項(xiàng)目以“云服務(wù)”的模式開(kāi)展,所有的項(xiàng)目數(shù)據(jù)都會(huì)推送到云上,標(biāo)準(zhǔn)分析都由技術(shù)人員完成,項(xiàng)目相關(guān)的數(shù)據(jù)深入挖掘和個(gè)性化分析部分由技術(shù)人員帶領(lǐng)客戶在云上進(jìn)行,客戶也可以自主在云端進(jìn)行數(shù)據(jù)分析,簡(jiǎn)單來(lái)說(shuō)就是數(shù)據(jù)分析科研人員想自己做就自己做,不想自己做就交給公司做,這種模式能夠解決服務(wù)公司售后個(gè)性化分析期限的問(wèn)題,科研人員可以在云上進(jìn)行分析,直到文章的發(fā)表;“云賬號(hào)”主要針對(duì)做過(guò)或熟悉高通量測(cè)序,手里有一些沒(méi)有完全挖掘的數(shù)據(jù),還想充分利用公用數(shù)據(jù)的用戶,經(jīng)過(guò)簡(jiǎn)單的培訓(xùn)后,就可以在云平臺(tái)上自主分析數(shù)據(jù),多種分析軟件都可以使用,深入挖掘自己以前的所有項(xiàng)目數(shù)據(jù),也可以利用NCBI等公共數(shù)據(jù)進(jìn)行挖掘研究,課題組的多個(gè)成員可以同時(shí)開(kāi)展多個(gè)項(xiàng)目,提高研究的效率。
科技服務(wù)2.0時(shí)代對(duì)科研工作者是一個(gè)新的機(jī)遇。對(duì)于科研經(jīng)費(fèi)相對(duì)充足的科學(xué)家,自己往往做較多的測(cè)序項(xiàng)目,以云模式進(jìn)行分析能節(jié)省大量的分析經(jīng)費(fèi),提高經(jīng)費(fèi)的使用效率,產(chǎn)出更多科研成果。對(duì)于科研經(jīng)費(fèi)相對(duì)不太充裕的科學(xué)家,可以通過(guò)充分利用公共數(shù)據(jù)進(jìn)行科學(xué)研究,節(jié)省了不必要的測(cè)序費(fèi)用,用云模式同樣可以產(chǎn)出豐碩的科研成果。
百邁客云從2013年開(kāi)始開(kāi)發(fā),經(jīng)過(guò)小伙伴們2年多的開(kāi)發(fā)和內(nèi)部外部測(cè)試,以每周一個(gè)新版本的迭代速度于2015年正式邁入市場(chǎng),成為針對(duì)生命科學(xué)家的“Turn-key?BioCloud”,2016年開(kāi)始全國(guó)推廣。百邁客云得到了像中國(guó)科學(xué)院院士陳潤(rùn)生院士、中科院基因組所于軍研究員、北京大學(xué)羅靜初教授等中國(guó)生物信息領(lǐng)域的權(quán)威專家的大力支持和幫助。百邁客云日臻完善,可以開(kāi)放的讓科研工作者來(lái)體驗(yàn)和使用,目前已經(jīng)有上萬(wàn)科研用戶注冊(cè)使用,開(kāi)啟了云端自主數(shù)據(jù)深入挖掘的新時(shí)代。得到廣大科研用戶的肯定是對(duì)我們最大的鼓勵(lì),百邁客“云模式”將持續(xù)迭代開(kāi)發(fā),繼續(xù)引領(lǐng)科技服務(wù)2.0時(shí)代,更好的服務(wù)于科研工作者,加速科研創(chuàng)新,“成就客戶”是我們服務(wù)的理念,讓每一個(gè)課題組都具備生物信息分析能力,讓每一位科學(xué)家能從百邁客云模式中受益。