?
“你很難想象當(dāng)我們的通量提升呈現(xiàn)指數(shù)級增長后,在算力和存儲資源上的那種束縛感。“
北京希望組生物科技有限公司(簡稱希望組)的首席信息官朱贏,在談到一年多前業(yè)務(wù)發(fā)展遇到IT瓶頸時,舉了一個形象的例子:我們目前滿載通量每天能夠產(chǎn)生100TB的數(shù)據(jù),假設(shè)線下機房現(xiàn)在有一個PB的存儲能力,只要10天就會存滿。這100TB的存儲資源我前期可能已經(jīng)花費了一百多萬元,還只是硬件上的投入,不算電力消耗和人力維護成本。資源不夠怎么辦?又要再花一百萬,又要去巨資投入系統(tǒng)建設(shè)?
作為全球最大的第三代基因測序企業(yè)之一,希望組在2017到2018年配置完成了完整的三代測序技術(shù)平臺,正式面向全球用戶開始提供PromethION人類基因組重測序服務(wù)。簡單地說,相對于二代測序技術(shù),三代基因測序的應(yīng)用落地如同將燃油車換成了高鐵。
“速度”快了,測序能力也大幅提升,但是通量爆發(fā)式增長的同時,希望組也遇到了最大的“瓶頸”。除了前面朱贏提到的存儲資源難題,公司在算力、IT運維、成本控制和人力調(diào)配等很多方面都遇到了挑戰(zhàn)。
上云:應(yīng)對全行業(yè)挑戰(zhàn)
基于第三代基因測序技術(shù),雖然可以同時進行大量基因片段的快速測序,數(shù)據(jù)的存儲量也呈現(xiàn)指數(shù)及增長。“如果要對這些數(shù)據(jù)文件進行分析和計算的話,大概每天都需要有十萬核小時的時間來完成計算。這是原有機房的算力無法想象的?!?/p>
朱贏表示,希望組的科學(xué)家、工程師主要是從事基因研究,就不太會在IT方面耗費太多心力和資源。“我們必須要讓研究人員從IT基礎(chǔ)設(shè)施的復(fù)雜性里解放出來,讓大家投入更多的精力,回歸自己應(yīng)該起到作用的基因組學(xué)研究上?!?/b>
“實際上,這要求我們在算力和存儲方面,不僅是資源充足的問題,還要有極強的擴展性,隨時能夠不斷地往外擴充這種能力,并按照需求能收能放?!敝熠A斬釘截鐵地說到,“我們決定全面上云!”
可以說,希望組在一兩年前遇到的這些困阻,也是整個基因測序行業(yè)的共同挑戰(zhàn)。
隨著上世紀(jì)90年代“人類基因組計劃”的啟動至今,人類的30億個堿基和數(shù)萬個基因序列已被測定完成?;驕y序,這一針對人類生命密碼進行“讀取”的技術(shù),也從最初的一代,二代,逐步進入了第三代。
與此同時,隨著基因測序技術(shù)的成熟,個人基因測序行業(yè)快速進入繁榮時期,越來越多關(guān)注健康和生命質(zhì)量的人開始對基因測序提出了更大的需求。不過,第三代基因測序數(shù)據(jù)量較二代也出現(xiàn)了百倍增長,在呈現(xiàn)更加科學(xué)、精準(zhǔn)測序結(jié)果的同時,第三代基因技術(shù)也遇到了算力、存儲能力等方面的IT資源瓶頸,迫切需要解決效率遲緩、投資巨大、成本增加的難題。
而與基因測序企業(yè)的挑戰(zhàn)相對應(yīng)的,是公眾在享受基因測序服務(wù)時面臨的痛點:測試時間耗時較長;專業(yè)測試費用高昂,市場價格不透明甚至混亂;缺乏權(quán)威的測試結(jié)果分析解讀……
解密:獲取降本增效的創(chuàng)新秘訣
有一點可以確定,基因測序行業(yè)在解決自身痛點的同時,也將解決公眾需求方面的難題。
在懂懂看來,“上云”正是整個基因測試行業(yè)面對挑戰(zhàn)的首選路徑,通過云計算、大數(shù)據(jù)和AI算法等科技手段的助力,解決這個行業(yè)的普遍痛點,最終在“降本、增效和創(chuàng)新”這三個關(guān)鍵詞上取得跨越性的突破。
“其實上云的問題,我們兩年前就已經(jīng)開始考慮了。首先術(shù)業(yè)有專攻,作為一家基因測序的公司,我們的主業(yè)不在IT;其次,我們希望能夠和一家理解、懂得基因行業(yè)的云服務(wù)商合作?!?/p>
朱贏當(dāng)時對比過好幾家云服務(wù)廠商,前期在云化的過程中也踩了不少坑。而之后正式確定使用華為云,主要是因為與華為云在三個方面的高度契合:“一方面是華為云在軟件層面,跟我們在IT規(guī)劃上的理念比較契合;第二個方面是我們認可華為云在底層技術(shù)方面的實力,比如說它在全球電信網(wǎng)絡(luò)設(shè)備、芯片方面的研發(fā)實力;最后一個方面是因為華為云在后端的技術(shù)支持和服務(wù)方面做得非常到位?!?/b>
?
朱贏坦言,華為云在云計算領(lǐng)域并不是啟動最早的企業(yè),但恰恰是這三個方面的契合,讓希望組決定與華為云共同成長,在雙方于各自領(lǐng)域即將騰飛的階段,一起在云計算和基因行業(yè)實現(xiàn)更多創(chuàng)新舉措,為兩個領(lǐng)域的融合發(fā)展帶來一些改變。
朱贏在談到“理念契合”時強調(diào),原先希望組就已經(jīng)選定了用云容器(Container)技術(shù)方案來實現(xiàn)自己對于計算資源的多項需求,而華為云恰好將精準(zhǔn)基因組分析容器化解決方案作為了業(yè)務(wù)重點。
華為云近年來一直在研發(fā)方面持續(xù)加大投入,先后推出了云容器實例(CCI)服務(wù)、FPGA加速云解決方案和基因容器服務(wù)(GCS)等創(chuàng)新技術(shù)。其中頗受希望組青睞的基因容器技術(shù),已成為基因行業(yè)的首選。華為云基因容器的特點是能提供大規(guī)模的算力資源池,極大地提升基因數(shù)據(jù)分析效率,30X的全基因組測序(WGS)測序速度可提升近10倍。
?
同時,針對基因行業(yè)普遍存在的工具碎片化、開發(fā)語言多樣、系統(tǒng)維護困難等瓶頸,華為云的基因容器解決方案也著重在“快、省、易、捷”這四字上做足了準(zhǔn)備。
“快”,是指極速測序:支持10萬容器規(guī)模,可以超高并發(fā)運行測序分析流程,可極大的縮短測序時長,面對大規(guī)模并發(fā),得益于高性能容器批量計算平臺Volcano的高效任務(wù)調(diào)度能力,可以避免任務(wù)的死鎖、減少等待時間,進一步提升測序分析效率 ;
“省”,來自于高性價比:算力資源按需、按秒計費,CPU/內(nèi)存根據(jù)業(yè)務(wù)訴求靈活配比,避免浪費,提升性價比;
“易”,在于免運維:基于Serverless架構(gòu)的容器服務(wù),集群資源自動化擴縮容,分析流程根據(jù)預(yù)置規(guī)則可以自動化觸發(fā)和執(zhí)行;
“捷”,就是一站式:將基因測序分析與數(shù)據(jù)挖掘能力統(tǒng)一到一套流程里面,避免多套系統(tǒng)操作帶來的不便。
希望組與華為云聯(lián)合打造的精準(zhǔn)基因組分析容器化解決方案即將發(fā)布。該方案以華為云基因容器作為基礎(chǔ)平臺,結(jié)合希望組在基因行業(yè)內(nèi)多年來的業(yè)務(wù)積累,更貼近基因測序行業(yè)客戶的訴求,實現(xiàn)了更快、更易運維、更高性價比的結(jié)果。這套方案將希望組原有的單流程時長從22小時降低到了17小時,并節(jié)約測序成本30%。
陪伴:與行業(yè)用戶共同成長
華為云負責(zé)基因測序行業(yè)的解決方案總監(jiān)嚴(yán)斌告訴懂懂筆記, “我們通過對客戶深度的理解,更好地配合用戶的需求,為他們提供底層的IT技術(shù)能力,同時也希望包括希望組這樣的企業(yè)能夠結(jié)合自身業(yè)務(wù)提出更多訴求,促使我們的研發(fā)團隊提供更強大的支持力度,陪伴用戶共同發(fā)展和成長。”
除了與客戶共同成長,華為云還希望通過合作為基因行業(yè)的生態(tài)環(huán)境做出貢獻,“為了更好地服務(wù)于基因測序行業(yè),我們和希望組打造了聯(lián)合實驗室。初衷和目的就是滿足基因行業(yè)客戶的需求,能在第一時間快速響應(yīng)、快速閉環(huán),同時協(xié)力幫助行業(yè)創(chuàng)造更好的生態(tài)氛圍?!眹?yán)斌表示。
如今,通過與華為云的合作,希望組的200多位科研人員得以聚焦自身的核心工作,同時在融合創(chuàng)新中取得了更多基因領(lǐng)域的學(xué)術(shù)和技術(shù)創(chuàng)新,包括在權(quán)威學(xué)術(shù)期刊發(fā)表多篇論文,以及聯(lián)合發(fā)布了基因行業(yè)的通用計算標(biāo)準(zhǔn)。
同時,在國內(nèi)基因行業(yè)中Top15的企業(yè)已經(jīng)有13家采用了華為云的服務(wù)。其中,上海其明信息技術(shù)有限公司在華為云容器CCI支持下,其基因檢測與基因云計算的綜合平臺GCBI已完成25萬例基因數(shù)據(jù)分析和挖掘、協(xié)助作出1萬多次基于基因信息的臨床決策。數(shù)據(jù)顯示,將業(yè)務(wù)部署在CCI后,上海其明的實際計算成本降低了30%~50%,實現(xiàn)了K8S和物理資源免運維。
?
在AI輔助宮頸癌篩查領(lǐng)域,廣州金域醫(yī)學(xué)攜手華為云取得了重大突破。今年6月中旬,雙方聯(lián)合宣布首次基于病理形態(tài)學(xué),通過深度學(xué)習(xí)技術(shù)訓(xùn)練出精準(zhǔn)、高效的AI輔助宮頸癌篩查模型。尤其在AI技術(shù)支持方面,華為云全流程模型生產(chǎn)服務(wù)ModelArts從標(biāo)注、訓(xùn)練模型、圖片判斷、推理等方面,都為AI模型的訓(xùn)練和應(yīng)用提供了極為堅實的基礎(chǔ)。
另外,金橡醫(yī)學(xué)攜手華為云共建的腫瘤精準(zhǔn)醫(yī)療基因大數(shù)據(jù)分析平臺,圖靈生物與華為云聯(lián)合開發(fā)的生信數(shù)據(jù)分析處理平臺——GenoStack生信云平臺,峰科計算與華為云共同推出的基于FPGA的基因加速云解決方案等,都已經(jīng)成為國內(nèi)基因科學(xué)領(lǐng)域行業(yè)云化的成功案例。
數(shù)據(jù)顯示,2016年國內(nèi)參與消費級基因檢測并擁有自身數(shù)據(jù)的個人用戶總量約為10萬人,2017年約為30萬人。目前,中國個人基因檢測服務(wù)的人口滲透率是0.03%,而未來5年這一數(shù)字會達到3.5%。
這些數(shù)字意味著,到2022年中國將有5000萬人擁有自己的基因組數(shù)據(jù)。面對迅速爆發(fā)的市場需求,國內(nèi)基因測序勢必要加快全行業(yè)云化的步伐,以應(yīng)對行業(yè)轉(zhuǎn)折的機遇與挑戰(zhàn)。
【結(jié)束語】
隨著基因科學(xué)領(lǐng)域的全面發(fā)展以及數(shù)據(jù)中心的全面云化,基因測序行業(yè)“上云”是大勢所趨。在基因測序領(lǐng)域,以數(shù)據(jù)分析、云計算為主導(dǎo)的IT技術(shù)已經(jīng)成為驅(qū)動行業(yè)創(chuàng)新、變革的重要因素。通過強大的資源、完整而先進的產(chǎn)品組合以及強大的服務(wù)能力,華為云正在為更多基因測序和生物科技企業(yè)提供著差異化、專業(yè)化的服務(wù),這也是華為云能在行業(yè)內(nèi)Top15企業(yè)中合作率超過85%的主要原因。
基因測序企業(yè)的上云目標(biāo)是降本、增效和創(chuàng)新,而公眾對于基因測序的需求則是更加實惠、檢測更快,以及實現(xiàn)自己對生命品質(zhì)的高層次追求。于這兩方面,相信華為云可以做到更多。
9月18日,希望組與華為云將在HUAWEI CONNECT 2019現(xiàn)場,發(fā)布聯(lián)合打造的精準(zhǔn)基因組分析容器化解決方案,敬請關(guān)注。
——————————————————————————————————
微信關(guān)注公眾號“懂懂筆記”每天第一時間為您奉上最新最熱的科技圈資訊~
多年財經(jīng)媒體經(jīng)歷,業(yè)內(nèi)資深分析人士,圈中好友眾多,信息豐富,觀點獨到。
發(fā)布各大自媒體平臺,覆蓋百萬讀者。
《小米生態(tài)鏈戰(zhàn)地筆記》、《微信思維》、《微信力量》三本暢銷書的作者
請登錄以參與評論
現(xiàn)在登錄