omniture

承啟生物解碼全基因組破紀(jì)錄背后:中國(guó)原創(chuàng)醫(yī)學(xué)實(shí)現(xiàn)降本增效

深圳2020年7月13日 /美通社/ -- 單機(jī)解碼全基因組,從需要幾天到1小時(shí),再到5分鐘,中國(guó)生物醫(yī)學(xué)原創(chuàng)技術(shù)究竟有多強(qiáng)?2020年6月,深圳承啟生物科技有限公司(以下簡(jiǎn)稱(chēng)“承啟生物”)利用自主研發(fā)的云平臺(tái)Chi-Cloud及高精度算法FANSe3,實(shí)現(xiàn)單機(jī)5分鐘分析完成一個(gè)人全基因組數(shù)據(jù)集,再度刷新世界紀(jì)錄。

承啟生物創(chuàng)始人、首席科學(xué)家張弓教授表示,“承啟生物的解決方案Chi-Cloud+FANSe3在攻破了無(wú)數(shù)個(gè)難題后,成功提升基因檢測(cè)分析速度。這一突破最值得關(guān)注的是全自主研發(fā)的FANSe算法,實(shí)現(xiàn)精準(zhǔn)度之上的速度飛躍;此外,這項(xiàng)中國(guó)原創(chuàng)技術(shù)不依賴專(zhuān)用加速芯片,讓基因測(cè)序不再被國(guó)外供應(yīng)商‘扼住咽喉’,大幅降低成本,為精準(zhǔn)醫(yī)療、普惠醫(yī)療貢獻(xiàn)力量?!?/p>

全自主技術(shù) 基因測(cè)序不再被扼住咽喉

核心技術(shù)是國(guó)家與企業(yè)的安身立命之本,只有實(shí)現(xiàn)核心技術(shù)自主才能不被扼住命運(yùn)的咽喉。承啟生物歷經(jīng)6年自主研發(fā)的FANSe算法已進(jìn)入第3代,張弓教授透露,這一算法不依賴專(zhuān)用加速硬件,從根本上避免芯片禁運(yùn)風(fēng)險(xiǎn),這項(xiàng)中國(guó)高端醫(yī)學(xué)技術(shù)將不再受制于人。

承啟生物開(kāi)發(fā)人員正在一臺(tái)高端家用電腦上調(diào)試Chi-Cloud
承啟生物開(kāi)發(fā)人員正在一臺(tái)高端家用電腦上調(diào)試Chi-Cloud

當(dāng)前全球基因組測(cè)序大部分使用的基礎(chǔ)算法為國(guó)外的BWA、Bowtie等系列算法,單機(jī)運(yùn)行效率并不高。為提高單機(jī)運(yùn)算速度,常見(jiàn)方案是采用GPU、FPGA等專(zhuān)用芯片進(jìn)行加速。但受?chē)?guó)內(nèi)芯片技術(shù)局限,目前國(guó)內(nèi)僅有自主CPU,而高性能通用計(jì)算GPU、FPGA等芯片依然被國(guó)外壟斷。承啟的FANSe3算法只使用CPU進(jìn)行計(jì)算,不依賴專(zhuān)用加速芯片,可做到在國(guó)產(chǎn)硬件上高效運(yùn)行。此外,單機(jī)5分鐘分析全基因組的高效能,意味著在對(duì)數(shù)據(jù)保密性要求的特殊領(lǐng)域(如軍事、公共安全、特定的醫(yī)療場(chǎng)景等),可直接采用單機(jī)分析方式(Chi-Cloud小云模式),無(wú)需連接互聯(lián)網(wǎng)。算法針對(duì)國(guó)產(chǎn)測(cè)序儀進(jìn)行特別適配和優(yōu)化,保障精準(zhǔn)醫(yī)學(xué)的國(guó)家安全。

為應(yīng)對(duì)國(guó)產(chǎn)CPU性能與國(guó)際頂尖水平的現(xiàn)實(shí)差距問(wèn)題,F(xiàn)ANSe3和承啟云平臺(tái)架構(gòu)在設(shè)計(jì)之初便支持大規(guī)模分布式運(yùn)算和自適應(yīng)任務(wù)調(diào)度,擴(kuò)展性強(qiáng),可利用多個(gè)CPU共同運(yùn)算一個(gè)任務(wù)?!皢螜C(jī)的性能弱了怎么辦?可以把2臺(tái)、3臺(tái)、4臺(tái)甚至100臺(tái)機(jī)器捆起來(lái)一起用,彌補(bǔ)單個(gè)CPU性能的不足,達(dá)到同樣甚至更好的使用體驗(yàn)?!睆埞淌谡f(shuō)。

“單機(jī)5分鐘”推動(dòng)精準(zhǔn)醫(yī)學(xué)“更快、更便宜”

由于核心技術(shù)完全自主,承啟生物團(tuán)隊(duì)可以對(duì)算法不斷改進(jìn),使FANSe3代算法在運(yùn)算速度上實(shí)現(xiàn)遠(yuǎn)超國(guó)外算法的飛躍。“單機(jī)5分鐘”的意義不僅限于提升時(shí)間和效率,更在于助推精準(zhǔn)醫(yī)學(xué)普及。

承啟生物實(shí)驗(yàn)室一景
承啟生物實(shí)驗(yàn)室一景

目前先進(jìn)的測(cè)序儀已能在一天內(nèi)完成測(cè)序?qū)嶒?yàn),但數(shù)據(jù)分析用單機(jī)通常需要幾十個(gè)小時(shí)才能完成,但對(duì)許多臨床急性病癥,時(shí)間就是生命。使用國(guó)外算法,各大云服務(wù)提供商在使用幾十上百臺(tái)服務(wù)器的情況下,僅能將分析時(shí)間壓縮至半小時(shí)到一小時(shí),而使用FPGA等專(zhuān)用加速芯片,也只能實(shí)現(xiàn)1-2小時(shí)的分析時(shí)間,而這些都需要巨額的硬件投入和專(zhuān)業(yè)維護(hù),能耗也居高不下。

本次承啟生物實(shí)現(xiàn)的單機(jī)5分鐘分析突破,可讓大型測(cè)序中心擺脫超算集群和專(zhuān)業(yè)人員維護(hù)需求;硬件購(gòu)置費(fèi)用大大降低,能耗也大為降低,綠色環(huán)保。

單機(jī)5分鐘的速度,網(wǎng)絡(luò)傳輸是整體分析中的瓶頸。一個(gè)人全基因組測(cè)序數(shù)據(jù)文件可高達(dá)240GB以上,以千兆網(wǎng)的速度都需要傳輸40多分鐘。為解決這一問(wèn)題,承啟為Chi-Cloud開(kāi)發(fā)了獨(dú)有的壓縮算法,達(dá)到了1:10以上甚至1:20的壓縮率,縮短原本漫長(zhǎng)的傳輸時(shí)間,多節(jié)點(diǎn)間的任務(wù)調(diào)配也更得心應(yīng)手;與FANSe3算法深度配合,無(wú)需解壓即可直接運(yùn)算。

使用高速的網(wǎng)絡(luò)接入,將數(shù)據(jù)傳輸至承啟生物的服務(wù)器上,測(cè)序中心甚至不需購(gòu)買(mǎi)和維護(hù)服務(wù)器,基因組測(cè)序的分析成本降至幾乎可以忽略不計(jì)的程度。

所有這些,都讓全基因組測(cè)序分析“更快”。以超高速的運(yùn)算助力重癥患者“與死神賽跑”,盡力避免治療“遲了一步”的遺憾,為醫(yī)生、患者爭(zhēng)取更多時(shí)間。

FANSe3算法+全鏈條穩(wěn)健 實(shí)現(xiàn)“更精準(zhǔn)”

與速度同樣重要的是算法的準(zhǔn)確性,張弓教授強(qiáng)調(diào),“準(zhǔn)確性是所有優(yōu)勢(shì)的前提。FANSe3是全球罕見(jiàn)的準(zhǔn)確率有數(shù)學(xué)證明的算法,錯(cuò)誤率已可穩(wěn)定在十億分之一以下。經(jīng)大量實(shí)驗(yàn)表明,F(xiàn)ANSe系列算法在基因組突變分析、轉(zhuǎn)錄組表達(dá)分析等應(yīng)用上,準(zhǔn)確度幾乎為100%,秒殺國(guó)外基于BWA、Bowtie等算法方案,并在醫(yī)學(xué)科研和臨床應(yīng)用中分析超過(guò)50萬(wàn)例樣本?!?/p>

2014年,F(xiàn)ANSe算法成為國(guó)際人類(lèi)蛋白質(zhì)組計(jì)劃核心支柱的首選分析算法,為全面解析人類(lèi)蛋白質(zhì)組做出了關(guān)鍵貢獻(xiàn)。2017年9月,在國(guó)際人類(lèi)蛋白質(zhì)組計(jì)劃世界大會(huì)上,以張弓教授等為代表的廣東科學(xué)家團(tuán)隊(duì)利用FANSe系列算法,發(fā)現(xiàn)數(shù)千個(gè)以往被認(rèn)為不可能存在的人類(lèi)“新蛋白質(zhì)”。最近,承啟云平臺(tái)在中國(guó)自主研發(fā)的基因組測(cè)序標(biāo)準(zhǔn)數(shù)據(jù)集的評(píng)測(cè)上,突變鑒定準(zhǔn)確性在全部幾十個(gè)標(biāo)準(zhǔn)數(shù)據(jù)集上均明顯高于國(guó)外主流算法。

算法足夠準(zhǔn)確了,但另一個(gè)無(wú)法回避的事實(shí)是要實(shí)現(xiàn)基因測(cè)序的準(zhǔn)確性,算法只是一方面,另一方面,從采樣、運(yùn)輸、前處理到測(cè)序的實(shí)驗(yàn)全過(guò)程必須萬(wàn)無(wú)一失,承啟生物稱(chēng)之為“全鏈條穩(wěn)健”。

承啟生物實(shí)驗(yàn)室一景
承啟生物實(shí)驗(yàn)室一景

張弓教授對(duì)“全鏈條穩(wěn)健”進(jìn)行解讀:“為什么有些分析結(jié)果容易出問(wèn)題?除部分算法不準(zhǔn)確的因素,樣本本身在采集、保存和運(yùn)輸過(guò)程中發(fā)生改變,也會(huì)導(dǎo)致誤差出現(xiàn)。而分散、小型化測(cè)序由于高度依賴專(zhuān)業(yè)人員,在現(xiàn)有的經(jīng)濟(jì)條件下暫時(shí)無(wú)法大量推廣,也就無(wú)法避免樣品保存和長(zhǎng)途運(yùn)輸,無(wú)形中增加精準(zhǔn)醫(yī)療普及的難度?!闭?yàn)閲?guó)內(nèi)基因測(cè)序受限于各種技術(shù)的不穩(wěn)定性,市場(chǎng)仍未實(shí)現(xiàn)真正發(fā)展。

而承啟生物的“穩(wěn)”,來(lái)源于對(duì)整個(gè)實(shí)驗(yàn)過(guò)程細(xì)節(jié)的精益求精和自主研發(fā)。承啟生物通過(guò)自有的保存運(yùn)輸技術(shù)方案,在不使用干冰、冰袋的情況下,DNA和RNA樣品可以經(jīng)受住-55~45°C的溫差波動(dòng)三天而保持完好。在樣本前處理和建庫(kù)階段,承啟研發(fā)的實(shí)驗(yàn)方案與“標(biāo)準(zhǔn)實(shí)驗(yàn)方案”不同,即便樣本發(fā)生降解,也能通過(guò)實(shí)驗(yàn)方法和算法容錯(cuò)等方法,實(shí)現(xiàn)近乎100%的準(zhǔn)確性。原創(chuàng)技術(shù)帶來(lái)的穩(wěn)健性擴(kuò)寬了基因檢測(cè)的應(yīng)用場(chǎng)景,讓基因檢測(cè)不再依賴大量專(zhuān)業(yè)人員,門(mén)檻大大降低。穩(wěn)健的體系也減少了因中間步驟造成的重復(fù)測(cè)定,進(jìn)一步壓縮了時(shí)間、降低成本。

“快、穩(wěn)、準(zhǔn)”制定標(biāo)準(zhǔn),助力精準(zhǔn)醫(yī)療大爆發(fā)

當(dāng)未來(lái)全基因組測(cè)序成為常規(guī)檢驗(yàn),全國(guó)每天處理的樣本將達(dá)到海量。基于承啟生物自主技術(shù)的超精準(zhǔn)和超高速,可解決海量樣本分析中的瓶頸與痛點(diǎn),讓基因測(cè)以低成本實(shí)現(xiàn)精準(zhǔn)醫(yī)學(xué)的落地,迎來(lái)廣泛應(yīng)用場(chǎng)景,為行業(yè)發(fā)展提供有力支撐。

當(dāng)前,承啟生物的自主化“快、穩(wěn)、準(zhǔn)”的技術(shù)體系,被認(rèn)定為國(guó)家重點(diǎn)計(jì)劃《醫(yī)學(xué)生命主學(xué)觀質(zhì)量控制關(guān)鍵技術(shù)與示范應(yīng)用》核酸組學(xué)部分的基礎(chǔ),也將成為今后國(guó)家相關(guān)質(zhì)控標(biāo)準(zhǔn)的重要依據(jù)。標(biāo)準(zhǔn)的建立,將規(guī)范整個(gè)行業(yè),助力精準(zhǔn)醫(yī)學(xué)應(yīng)用的行業(yè)爆發(fā),也為承啟生物開(kāi)啟更廣闊的發(fā)展前景。

消息來(lái)源:深圳承啟生物科技有限公司
China-PRNewsire-300-300.png
相關(guān)鏈接:
醫(yī)藥健聞
微信公眾號(hào)“醫(yī)藥健聞”發(fā)布全球制藥、醫(yī)療、大健康企業(yè)最新的經(jīng)營(yíng)動(dòng)態(tài)。掃描二維碼,立即訂閱!
collection