安永《生命科學(xué)4.0報告》曾用FV=ID描述生命科學(xué)的未來價值,即未來價值等于“創(chuàng)新”的“數(shù)據(jù)”次方。左右“價值”指數(shù)增長的“數(shù)據(jù)”,影響著科研成果的獲取。
根據(jù)《全民健康信息化調(diào)查報告》醫(yī)院大數(shù)據(jù)應(yīng)用情況調(diào)研結(jié)果顯示,2021年我國三級醫(yī)院醫(yī)療大數(shù)據(jù)平均應(yīng)用率不足20%,二級醫(yī)院不足5%,即使是熱度最高的臨床數(shù)據(jù),也只有1/5的醫(yī)院嘗試展開研究。
各類醫(yī)院大數(shù)據(jù)應(yīng)用開展情況(數(shù)據(jù)來源:《全民健康信息化調(diào)查報告》)
為了打破醫(yī)療大數(shù)據(jù)慘淡的應(yīng)用現(xiàn)狀,協(xié)助醫(yī)生挖掘各式醫(yī)療數(shù)據(jù)中的潛在價值,廣州中康數(shù)字科技有限公司借助百度飛槳深度學(xué)習(xí)、文心大模型等人工智能技術(shù),結(jié)合自研的數(shù)據(jù)采集網(wǎng)絡(luò)、大數(shù)據(jù)處理技術(shù)與生態(tài)化的健康產(chǎn)業(yè)平臺,打造“基于文心大模型的AI臨床科研大數(shù)據(jù)平臺”。
基于文心大模型構(gòu)建的AI臨床科研大數(shù)據(jù)平臺
近日,百度飛槳承辦的第四屆OpenI/O啟智開發(fā)者大會「深度學(xué)習(xí)與大模型產(chǎn)業(yè)應(yīng)用專場」上,中康科技數(shù)字醫(yī)療人工智能技術(shù)產(chǎn)品總監(jiān)黃毅寧表示。將大模型應(yīng)用于醫(yī)療,究竟能在醫(yī)療領(lǐng)域掀起怎樣的波瀾?
多模態(tài)醫(yī)療大數(shù)據(jù)處理,AI助力心臟驟停預(yù)警
通常而言,開發(fā)者們可以利用深度學(xué)習(xí)技術(shù)處理文本數(shù)據(jù)、圖像數(shù)據(jù)、文圖多模態(tài)等各類數(shù)據(jù),而多模態(tài)數(shù)據(jù)在醫(yī)療領(lǐng)域尤其常見。
“我們之前跟一位心內(nèi)科專家研究AI心臟驟停預(yù)警的課題。心臟驟停場景與常見的肺結(jié)節(jié)、肺炎等場景不一樣,它具有突發(fā)性,所以AI技術(shù)的應(yīng)用強調(diào)預(yù)測而非診斷。因此,要實現(xiàn)對心臟驟停進行盡可能精準地預(yù)警,我們不僅需要處理患者的臨床數(shù)據(jù),還需要分析心電圖數(shù)據(jù)、檢驗數(shù)據(jù),甚至患者發(fā)病時所處環(huán)境的水文氣象數(shù)據(jù)。從理論上講,數(shù)據(jù)源越豐富,模型預(yù)測越精準?!秉S毅寧解釋道。
為了有效利用多模態(tài)大數(shù)據(jù),中康科技基于飛槳搭建了AI臨床科研大數(shù)據(jù)平臺。具體而言,中康以飛槳自然語言處理模型庫PaddleNLP為基礎(chǔ),采用通用信息抽取技術(shù)文心ERNIE-UIE進行醫(yī)療數(shù)據(jù)結(jié)構(gòu)化;以中文醫(yī)療預(yù)訓(xùn)練模型文心ERNIE-Health為底座,應(yīng)用于醫(yī)療文本理解、分析等更多下游任務(wù)上。
除NLP技術(shù)外,CV等各領(lǐng)域技術(shù)也必不可少。中康科技運用了飛槳計算機視覺檢測模型庫PaddleDetection,采用RetinaNet和SSD進行目標(biāo)檢測,還基于飛槳時序建模庫PaddleTS的USAD和SCINet進行時序數(shù)據(jù)特征抽取,最終實現(xiàn)包括患者臨床數(shù)據(jù)、心電圖、心電時序、水文氣象等等多模態(tài)數(shù)據(jù)融合處理、解析與理解。
對于心臟驟?;颊叨?,發(fā)病后的每一分鐘救治時間都彌足珍貴。如果能夠通過預(yù)警提前感知危險,相信能夠挽救更多生命。融合各類模態(tài)數(shù)據(jù)的全新技術(shù)方案下,平臺預(yù)警效果顯著提升,已經(jīng)能夠提前5-10個小時預(yù)測患者心臟驟停的情況,助力醫(yī)療服務(wù)質(zhì)量大幅提升。豐富、多樣的醫(yī)療數(shù)據(jù)經(jīng)有效治理后,能夠進一步為臨床醫(yī)生提供輔助決策,也為后續(xù)的一系列臨床科研打下了堅實基礎(chǔ)。
從高維空間提取關(guān)鍵信息,AI助力康復(fù)診療服務(wù)
算力不足以處理大量的高維度數(shù)據(jù)是醫(yī)生科研過程中常常遇見的另一個問題。譬如,在訓(xùn)練超聲AI的過程中,研究人員需要從超聲影像的高維空間提取關(guān)鍵信息,但是在條件一般的醫(yī)院很難做到復(fù)雜度很高的模型訓(xùn)練與預(yù)測。面對這一情況,基于文心大模型的AI臨床科研大數(shù)據(jù)平臺可以為醫(yī)生提供強大的運算能力,使從前很難做到的高維度深度學(xué)習(xí)建模變得更容易。
為了更清晰地厘清高維度數(shù)據(jù)處理的價值,中康科技談到了與一位康復(fù)科主任合作研究的“四肢關(guān)節(jié)活動度AI識別模型建設(shè)”這一課題。簡單來說,該課題的目的是要用視頻的方式評估人們的行動力,替代傳統(tǒng)的問卷調(diào)查,幫助患者洞悉康復(fù)過程中的每一處變化并做出對應(yīng)決策,最終縮短康復(fù)時間,提升康復(fù)效率。
“在使用問卷評估行動力時,人們常常會在填寫時摻雜主觀因素,導(dǎo)致最終評估結(jié)果出現(xiàn)偏差,”黃毅寧表示,“通過要求用戶完成指定的姿態(tài)動作,使用視頻檢測的方式可以解決這一問題,更客觀更全面地完成用戶的行動力分級評價?!?/p>
這個課題的第一步是對人體姿態(tài)進行采集及分析處理,這一步驟中,中康科技運用了飛槳PaddleDetection視覺檢測模型庫,包括HRNet、DarkPose、SWAHR等模型自動化識別人體重要關(guān)節(jié)點,再使用PaddlePaddle深度學(xué)習(xí)框架構(gòu)建時間圖卷積神經(jīng)網(wǎng)絡(luò)根據(jù)關(guān)節(jié)點運動軌跡、運動幅度、運動速率等信息,實現(xiàn)用戶的行動力等級評價,并針對性不同等級用戶提供更精準地個性化的診療服務(wù)。
通過百度AI技術(shù)識別人體姿態(tài)動作,并對人群進行行動力等級分類的過程
500倍效率提升后,文心大模型不止于科研臨床大數(shù)據(jù)
除了上述兩種醫(yī)學(xué)科研常見問題外,中康還將基于飛槳,針對醫(yī)院數(shù)據(jù)的復(fù)雜情況,繼續(xù)深化數(shù)據(jù)治理。
總的來說,百度飛槳和文心大模型幫助中康科技實現(xiàn)數(shù)據(jù)治理能力的三級提升。
第一級,相較于傳統(tǒng)人工作業(yè),科研平臺的自然語言處理能力能將時間效率提升約10倍(時間短);第二級,基于文心大模型的小樣本學(xué)習(xí)僅需使用原來十分之一的數(shù)據(jù)量即可完成建模,效率再次提升10倍(數(shù)據(jù)量變小);第三級,規(guī)范化標(biāo)準化的數(shù)據(jù)治理使得一個專病數(shù)據(jù)庫能服務(wù)于多個科研項目,效率再次提升約5倍,整體實現(xiàn)約500倍的效率提升。
基于文心大模型的AI臨床科研大數(shù)據(jù)平臺正在以領(lǐng)先的AI技術(shù)助力客戶推進科研項目,進一步推進學(xué)科研究事業(yè)發(fā)展。
不過,效率的飛速提升并非打造AI臨床科研大數(shù)據(jù)平臺的全部目的。目前,中康科技已經(jīng)規(guī)劃好了基于飛槳和文心大模型繼續(xù)擴展大數(shù)據(jù)平臺的應(yīng)用邊界的具體路徑。
據(jù)黃毅寧透露,中康將基于本身在醫(yī)療領(lǐng)域深厚的數(shù)據(jù)積累,對文心ERNIE-Health進行領(lǐng)域適應(yīng)的大模型訓(xùn)練,進而將其應(yīng)用于醫(yī)學(xué)領(lǐng)域各類NLP任務(wù)之中。
AI臨床科研大數(shù)據(jù)平臺還將進一步對藥品說明、醫(yī)學(xué)病歷等內(nèi)容進行信息抽取及中文醫(yī)學(xué)術(shù)語對齊,自動構(gòu)建醫(yī)學(xué)知識圖譜。
這意味著,曾經(jīng)的AI臨床科研大數(shù)據(jù)平臺將跳出臨床數(shù)據(jù)范疇,逐步將醫(yī)院全域大數(shù)據(jù)納入治理范疇。
中康科技CTO唐珂軻博士表示:中康科技與百度飛槳通過技術(shù)研發(fā)、生態(tài)共建等方面搭建了合作橋梁,實現(xiàn)了繁榮共贏。未來,中康科技期待與百度飛槳建立更緊密的合作關(guān)系,以百度飛槳和文心大模型的人工智能技術(shù)優(yōu)勢,以中康科技在健康產(chǎn)業(yè)大數(shù)據(jù)的領(lǐng)先者地位、醫(yī)學(xué)科研領(lǐng)域的技術(shù)積累和沉淀,實現(xiàn)產(chǎn)品與方案的聯(lián)合創(chuàng)新。期待雙方全方位、多領(lǐng)域、更深入地交流,為中國醫(yī)學(xué)科研事業(yè)持續(xù)賦能,共創(chuàng)生命科學(xué)領(lǐng)域新篇章。