-
華中科大AI模型預(yù)測新冠生存率準(zhǔn)確率90%,有助早期介入
最后更新: 2020-03-19 17:16:13當(dāng)?shù)貢r(shí)間3月17日,醫(yī)藥學(xué)預(yù)印本平臺medRxiv發(fā)布了一項(xiàng)題為“A machine learning-based model for survival prediction in patients with severe COVID-19 infection”(未經(jīng)同行審議)的研究成果。這項(xiàng)由29名科學(xué)家共同進(jìn)行的研究利用了最新的可解釋機(jī)器學(xué)習(xí)算法,對預(yù)測COVID-19(新冠肺炎)患者存活率的生物標(biāo)志物進(jìn)行了揭示,并有望加強(qiáng)對新冠高?;颊叩脑缙诟深A(yù),降低死亡率。
研究團(tuán)隊(duì)來自華中科技大學(xué)同濟(jì)醫(yī)學(xué)院附屬同濟(jì)醫(yī)院、華中科技大學(xué)人工智能與自動化學(xué)院、劍橋大學(xué)植物科學(xué)學(xué)院等。文章的通訊作者為華中科技大學(xué)人工智能與自動化學(xué)院教授袁燁、同濟(jì)醫(yī)院麻醉科徐卉以及急診(重癥)醫(yī)學(xué)科科主任李樹生。
研究人員對武漢同濟(jì)醫(yī)院收治的404例COVID-19感染患者進(jìn)行血液樣本數(shù)據(jù)收集并進(jìn)行回顧性分析。通過機(jī)器學(xué)習(xí)工具,研究團(tuán)隊(duì)最終選擇了3種生物標(biāo)志物來預(yù)測個(gè)體患者的生存率,準(zhǔn)確性超過90%:LDH(乳酸脫氫酶)、淋巴細(xì)胞和hs-CRP(超敏C-反應(yīng)蛋白)。
特別是,僅LDH水平較高這一項(xiàng)指標(biāo)就能夠用于區(qū)分絕大多數(shù)需要立即就醫(yī)的病例。研究者們表示,這一發(fā)現(xiàn)與當(dāng)前醫(yī)學(xué)知識一致,即高LDH水平與各種疾?。òǚ尾考膊。绶窝祝┲邪l(fā)生的組織分解有關(guān)。
在當(dāng)前階段,對疾病的嚴(yán)重程度進(jìn)行快速、準(zhǔn)確和早期的臨床評估至關(guān)重要。然而目前,尚無確定的生物標(biāo)志物作為標(biāo)準(zhǔn),來區(qū)分需要立即就醫(yī)的患者。
此研究中,作者們運(yùn)用最先進(jìn)的機(jī)器學(xué)習(xí)框架,表明上述三種生物標(biāo)記物可以準(zhǔn)確預(yù)測疾病的嚴(yán)重程度,因此將大大減輕臨床參數(shù)監(jiān)測的壓力和其他相關(guān)的醫(yī)療負(fù)擔(dān)。
研究人員開發(fā)了基于XGBoost機(jī)器學(xué)習(xí)的預(yù)后模型,該模型使用患者最新一個(gè)血樣樣本能夠以90%以上的準(zhǔn)確度預(yù)測COVID-19重癥患者是否存活;使用其他血液樣本則能達(dá)到90%的預(yù)測準(zhǔn)確度。
該研究提出了一個(gè)簡單且可操作的公式,能夠?qū)π鹿诟呶;颊哌M(jìn)行快速檢測、早期干預(yù)并有可能降低他們的死亡率。
研究樣本與模型訓(xùn)練
研究人員進(jìn)行了分類任務(wù),將一般(general)、嚴(yán)重(severe)、危重(critical)患者的基本信息、癥狀、血液樣本、實(shí)驗(yàn)室檢查結(jié)果(包括肝功能、腎臟功能、凝血功能、電解質(zhì)、發(fā)炎因子)輸入,并將它們與檢測時(shí)期結(jié)束時(shí)的臨床后果(存活或死亡)相對應(yīng)。
研究樣本是同濟(jì)醫(yī)院2020年1月10日至2月20日期間收集的404位患者的醫(yī)療信息。這404位患者中,有213位康復(fù),其余191位死亡,作者們表示,高死亡率與同濟(jì)醫(yī)院作為定點(diǎn)醫(yī)院,收治了最嚴(yán)重的病例有關(guān)。研究人員使用標(biāo)準(zhǔn)病例報(bào)告表收集病歷,其中包括流行病學(xué)、人口統(tǒng)計(jì)學(xué)、臨床、藥物、護(hù)理和死亡率等信息。
研究人員用375例患者信息進(jìn)行算法開發(fā)(algorithm development),用29例作驗(yàn)證集(validation)
研究人員將患者的數(shù)據(jù)分為訓(xùn)練集(training)、測試集(test)和其他驗(yàn)證集(additional validation)。培訓(xùn)和測試集共計(jì)包含375名患者,而驗(yàn)證集包括29名患者。訓(xùn)練和測試集的樣本數(shù)按照7:3的比例設(shè)置,再進(jìn)行5次交叉驗(yàn)證。
驗(yàn)證集中的患者均為嚴(yán)重患者,因?yàn)榫团R床結(jié)果而言,他們是最不可預(yù)測的。從臨床癥狀來看,發(fā)燒是最常見的初始癥狀(49.9%),其次是咳嗽(13.9%),疲勞(3.7%)和呼吸困難(2.1%)。375名患者的年齡分布為58.83±16.46歲,男性占58.7%?;颊咧杏?7.9%是武漢居民,家族聚集性病例占6.4%,醫(yī)療工作者占1.9%。
樣本患者的年齡、性別、流行病史等特點(diǎn)
盡管大多數(shù)患者在整個(gè)住院期間都采集了多個(gè)血液樣本,但模型訓(xùn)練和測試僅使用了患者最近一次的血樣記錄作為輸入,以得到評估疾病嚴(yán)重程度的關(guān)鍵生物標(biāo)志物,區(qū)分需要立即醫(yī)療救助的患者以及準(zhǔn)確匹配每個(gè)標(biāo)簽的相應(yīng)功能。
患者3種生物標(biāo)志物的中位數(shù)值,以及25和75的百分位值
與死亡風(fēng)險(xiǎn)最相關(guān)的臨床特征
研究人員使用了一種名為XGBoost的分類器作為預(yù)測器模型,XGBoost是一種高性能的機(jī)器學(xué)習(xí)算法,由于其基于樹型(tree-based)方法的遞歸決策系統(tǒng),其具有巨大的可解釋性。模型的輸出對應(yīng)著患者的生存情況,研究人員將幸存的患者歸為0類,死亡的患者歸為1類。
研究人員沒有采用黑匣子建模(black-box modelling)策略的原因在于,其內(nèi)部模型機(jī)制通常很難解釋。在XGBoost中,每個(gè)單個(gè)功能的重要性取決于其在樹中每個(gè)決策步驟中的累積使用量。這樣就可以在其中得到一個(gè)度量標(biāo)準(zhǔn),來表征每個(gè)特征的相對重要性,這對于評估模型結(jié)果中最具區(qū)別性的特征特別有價(jià)值,尤其是當(dāng)研究與臨床上的醫(yī)療參數(shù)有關(guān)時(shí)。
為了評估發(fā)生死亡風(fēng)險(xiǎn)的標(biāo)記,研究人員通過特征選擇過程評估了每個(gè)患者參數(shù)對算法決策的貢獻(xiàn)。XGBoost根據(jù)功能的重要性對功能進(jìn)行了排名,該算法選擇了三個(gè)排名最靠前的臨床特征:LDH、淋巴細(xì)胞和hs-CRP,因此,它們被設(shè)置為關(guān)鍵特征。
根據(jù)其在多樹XGBoost算法中的重要性,研究人員對十大關(guān)鍵臨床特征進(jìn)行了排名,LDH,淋巴細(xì)胞和hs-CRP排名前三
結(jié)果表明,該模型能夠準(zhǔn)確預(yù)測患者的結(jié)局,而無需考慮入院時(shí)的最初診斷。
此外,附加驗(yàn)證集的性能類似于訓(xùn)練和測試集的性能,這表明該模型捕獲了有關(guān)患者生存的關(guān)鍵生物標(biāo)志物。同時(shí),算法結(jié)果進(jìn)一步強(qiáng)調(diào)了LDH作為患者生存率的關(guān)鍵生物標(biāo)志物的重要性。
三大關(guān)鍵特征的訓(xùn)練/測試拆分和附加驗(yàn)證集的模型性能,F(xiàn)1分?jǐn)?shù)(F1-score)是算法精確率和召回率的調(diào)和平均數(shù),最大為1,最小為0
根據(jù)關(guān)于LDH,淋巴細(xì)胞和hs-CRP重要性的發(fā)現(xiàn),研究人員進(jìn)一步構(gòu)建了簡化的且可在臨床上應(yīng)用的決策模型,即單個(gè)決策樹(single decision tree)。由于共有24例患者的三種主要生物標(biāo)志物中至少有一種測量值不完整,研究人員利用剩下351例患者鑒定了單樹XGBoost模型。
簡單來說,就是研究人員選擇了模型中性能最佳的樹,使用三個(gè)關(guān)鍵特征及其閾值,可以預(yù)測病人死亡或是存活。
根據(jù)測試數(shù)據(jù)集選擇的性能最佳的樹及其準(zhǔn)確性
這一模型顯示了100%的死亡預(yù)測精度和90%的生存預(yù)測精度??傮w而言,無論是多樹XGBoost還是單樹XGBoost模型,模型對于生存和死亡預(yù)測的準(zhǔn)確性、宏觀和加權(quán)平均數(shù)的得分始終超過0.90。
最后,大多數(shù)患者在住院期間都接受了多次血液采樣。研究人員又通過上千份額外的血液測試結(jié)果對模型進(jìn)行了驗(yàn)證,發(fā)現(xiàn)預(yù)測準(zhǔn)確度達(dá)到了90%。此外相關(guān)結(jié)果進(jìn)一步表明該模型可以應(yīng)用于任何血液樣本,無論患者有怎樣的臨床結(jié)果。
提早識別高?;颊?,快速確定優(yōu)先級
研究者們表示,這項(xiàng)研究的意義是雙重的。首先,一般的相關(guān)研究只會“提供高風(fēng)險(xiǎn)因素的范圍”,而這一模型則提供了一種簡單直觀的臨床測試,進(jìn)而可以準(zhǔn)確快速地量化死亡風(fēng)險(xiǎn)。
如果醫(yī)生能夠提早知道,對于某些患者來說某些療法會導(dǎo)致治療效果不理想,那么醫(yī)生就能搶在病癥變得更嚴(yán)重之前采用不同的方法。應(yīng)用這一模型的目標(biāo)是在不可逆性病變發(fā)生之前識別高?;颊?/strong>。
其次,任何一家醫(yī)院都可以輕松收集病人的LDH(乳酸脫氫酶)、淋巴細(xì)胞和hs-CRP(超敏C-反應(yīng)蛋白)這三個(gè)關(guān)鍵指標(biāo)信息。在擁擠的醫(yī)院中醫(yī)療資源短缺的情況下,這種簡單的模型可以幫助快速確定患者的優(yōu)先級。
患者LDH水平的增加能夠反映組織或細(xì)胞的破壞,被認(rèn)為是組織或細(xì)胞損傷的常見征兆。血清LDH已被確定為特發(fā)性肺纖維化(IPF)嚴(yán)重程度的重要生物標(biāo)志物。
在患有嚴(yán)重肺間質(zhì)疾病的患者中,LDH的增加是顯著的,并且這是患者肺損傷最重要的預(yù)后指標(biāo)之一。因此對于重癥COVID-19患者而言,LDH水平的升高表明肺損傷的嚴(yán)重程度增加。
研究團(tuán)隊(duì)指出,較高的血清hs-CRP值也可用于預(yù)測嚴(yán)重COVID-19患者的死亡風(fēng)險(xiǎn)。hs-CRP的增加是ARDS(急性呼吸窘迫綜合征)患者預(yù)后不良的重要標(biāo)志,反映了炎癥的持續(xù)狀態(tài)。
值得注意的是,這種持續(xù)性炎癥反應(yīng)的結(jié)果可以從COVID-19死者的尸檢中看到,即肺部出現(xiàn)大量灰白色病變,在組織切片中,還可見肺泡溢出大量黏性分泌物。
最后,研究結(jié)果還表明淋巴細(xì)胞可能充當(dāng)潛在的治療靶標(biāo),這一假說得到了臨床研究結(jié)果的支持。此外,此前包括北京中日友好醫(yī)院呼吸科主任曹彬團(tuán)隊(duì)在內(nèi)的研究者們已經(jīng)證明,淋巴細(xì)胞減少癥是COVID-19患者的常見特征,可能是與疾病嚴(yán)重程度和死亡率相關(guān)的關(guān)鍵因素。
與SARS和MERS患者的肺泡穿透和抗原呈遞細(xì)胞(APC)受損途徑一樣,新冠肺炎患者損傷的肺泡上皮細(xì)胞可以誘導(dǎo)淋巴細(xì)胞浸潤,導(dǎo)致持續(xù)性淋巴細(xì)胞減少。
此前的一項(xiàng)患者活檢研究表明,外周血CD4和CD8 T細(xì)胞的數(shù)量大大減少,而它們的狀態(tài)被過度激活。此外,也有研究表示淋巴細(xì)胞減少癥主要與CD4和CD8 T細(xì)胞的減少有關(guān)。因此,淋巴細(xì)胞可能在COVID-19中發(fā)揮著明顯的作用,這值得進(jìn)一步研究。
作者們表示,這項(xiàng)研究同樣存在一定的局限性。首先,由于這一機(jī)器學(xué)習(xí)方法是純粹由數(shù)據(jù)驅(qū)動的,因此,如果從不同的數(shù)據(jù)集開始研究,則模型可能會有所不同。
此外,盡管作者們掌握了80多項(xiàng)臨床測量結(jié)果,但為了避免過擬合(overfitting),團(tuán)隊(duì)采用的建模原理是在最少臨床測量結(jié)果數(shù)量和良好預(yù)測能力之間進(jìn)行權(quán)衡,因此可能存在臨床測量結(jié)果不夠豐富的問題。
最后,這項(xiàng)研究在模型的可解釋性和更高的準(zhǔn)確性之間進(jìn)行平衡。盡管臨床環(huán)境傾向于使用可解釋的模型,但如果采用黑匣子模型,則準(zhǔn)確性可能更高,但同時(shí)決策風(fēng)險(xiǎn)更高。
從技術(shù)角度來看,作者們認(rèn)為這項(xiàng)工作有助于使用機(jī)器學(xué)習(xí)方法為正在全球大規(guī)模暴發(fā)的COVID 19病例進(jìn)行預(yù)測和診斷。
標(biāo)簽 新冠病毒- 原標(biāo)題:華中科大AI模型預(yù)測新冠生存率準(zhǔn)確率90%,有助早期介入
- 責(zé)任編輯: 連政 
-
派億元消費(fèi)券、領(lǐng)導(dǎo)帶頭“逛吃”,各地為刺激消費(fèi)拼了
2020-03-19 17:09 新冠肺炎抗疫戰(zhàn) -
湖北省委書記呼吁全國:善待湖北人與湖北農(nóng)副產(chǎn)品
2020-03-19 16:01 新冠肺炎抗疫戰(zhàn) -
中國網(wǎng)友調(diào)侃特朗普,胡錫進(jìn)用推特轉(zhuǎn)告了
2020-03-19 15:32 特朗普 -
防控生產(chǎn)兩手抓 習(xí)近平因時(shí)因勢再部署
2020-03-19 15:20 新冠肺炎抗疫戰(zhàn) -
外交習(xí)語 | 關(guān)于全球戰(zhàn)“疫”,習(xí)近平傳遞最新信息
2020-03-19 15:17 新冠肺炎抗疫戰(zhàn) -
阻止疫情跨國擴(kuò)散 文旅部提醒充分評估出國旅游引發(fā)感染風(fēng)險(xiǎn)
2020-03-19 15:10 新冠肺炎抗疫戰(zhàn) -
政策“組合拳”穩(wěn)住外貿(mào)基本盤
2020-03-19 15:10 中國經(jīng)濟(jì) -
促消費(fèi)回補(bǔ)全方位發(fā)力 更多政策利好將出
2020-03-19 15:10 中國經(jīng)濟(jì) -
“全面禁食”標(biāo)本兼治 中國力斬“野味產(chǎn)業(yè)”黑色鏈條
2020-03-19 15:06 新冠肺炎抗疫戰(zhàn) -
專家:新冠肺炎輕型普通型患者一般不會有后遺癥
2020-03-19 15:06 新冠肺炎抗疫戰(zhàn) -
青春閃亮最前線——走近ICU病房里的“90后”醫(yī)護(hù)人員
2020-03-19 15:02 新冠肺炎抗疫戰(zhàn) -
湖北:人員省內(nèi)流動除了健康碼之外不得附加其他條件
2020-03-19 15:01 新冠肺炎抗疫戰(zhàn) -
檢方提醒:在自家田里捕獵野生動物也違法
2020-03-19 15:00 依法治國 -
湖北0!
2020-03-19 14:59 新冠肺炎抗疫戰(zhàn) -
時(shí)政微視頻丨總書記指揮這場人民戰(zhàn)爭——凝心聚力
2020-03-19 14:51 新冠肺炎抗疫戰(zhàn) -
杭州西湖區(qū)回應(yīng)“美國女留學(xué)生硬闖小區(qū)”
2020-03-19 14:38 新冠肺炎抗疫戰(zhàn) -
好奇,中國怎么在疫情期間保障超市供應(yīng)穩(wěn)定?
2020-03-19 13:32 新冠肺炎抗疫戰(zhàn) -
廣東9例境外輸入病例,行動軌跡公布
2020-03-19 13:23 新冠肺炎抗疫戰(zhàn) -
武漢:居民可在無疫情小區(qū)內(nèi)非聚集性個(gè)人活動
2020-03-19 11:49 新冠肺炎抗疫戰(zhàn) -
甘肅5名公職人員私接境外人員回國被行拘
2020-03-19 11:03 依法治國
相關(guān)推薦 -
最新聞 Hot
-
尹錫悅被罷免
-
“去美國?中企有錢沒處花了嗎?”
-
馬克龍:別天真了!歐盟要暫停對美投資
-
對中國進(jìn)口產(chǎn)品征收關(guān)稅,特朗普政府被起訴
-
“特朗普想得很美,但我老死前能不能看到就不知道了”
-
美聯(lián)航一波音737客機(jī)在空中起火
-
加拿大對美國出手:25%!
-
逃跑的黑熊,找到了
-
“美國這么做,堵不住我的嘴”
-
“對等關(guān)稅”竟是這么算的?經(jīng)濟(jì)學(xué)家集體傻眼
-
“果然,中國說對了”
-
加拿大發(fā)愁:躲過子彈,卻撞上坦克
-
內(nèi)塔尼亞胡來了,匈牙利退了
-
“禁令之前就有,但伯恩斯離任前擴(kuò)大了范圍”
-
“地球上沒一個(gè)地方是安全的”
-
“美國是特朗普關(guān)稅政策下的最大輸家”
-