近日,河北大學(xué)網(wǎng)絡(luò)空間安全與計(jì)算機(jī)學(xué)院本科生作為第一作者撰寫(xiě)的論文“CausalMedLM: Causal Inference-Augmented LLMs for High-Accuracy Disease Prediction”(《CausalMedLM:用于高精度疾病預(yù)測(cè)的因果推斷增強(qiáng)大型語(yǔ)言模型》)在中國(guó)科學(xué)院一區(qū)TOP期刊KBS (Knowledge-Based Systems) 上發(fā)表。第一作者趙懷遠(yuǎn)(2022級(jí)計(jì)算機(jī)科學(xué)與技術(shù)專(zhuān)業(yè)本科生,推免至南開(kāi)大學(xué)),第二作者黃金來(lái)(2025屆計(jì)算機(jī)科學(xué)與技術(shù)專(zhuān)業(yè)本科畢業(yè)生,推免至中國(guó)科學(xué)院大學(xué))。指導(dǎo)教師為網(wǎng)絡(luò)空間安全與計(jì)算機(jī)學(xué)院常卓老師(通訊作者)。
大語(yǔ)言模型(LLMs)給醫(yī)療決策支持系統(tǒng)帶來(lái)革命性變化。然而,由于結(jié)構(gòu)化醫(yī)療數(shù)據(jù)存在類(lèi)別不平衡問(wèn)題,疾病預(yù)測(cè)的準(zhǔn)確性受到限制。傳統(tǒng)機(jī)器學(xué)習(xí)方法因其固有的統(tǒng)計(jì)相關(guān)性偏見(jiàn)和對(duì)因果關(guān)系的忽視,難以有效解決這一難題。為應(yīng)對(duì)此挑戰(zhàn),作者提出CausalMedLM框架,該框架將領(lǐng)域特定的因果推斷與大語(yǔ)言模型深度融合,通過(guò)構(gòu)建癥狀-疾病因果圖、因果約束的醫(yī)療知識(shí)序列表示轉(zhuǎn)換、C2IO-STAR提示框架引導(dǎo)LLM進(jìn)行精準(zhǔn)因果推理,構(gòu)建可解釋的疾病診斷,顯著提升罕見(jiàn)病預(yù)測(cè)能力,同時(shí)保持常見(jiàn)病診斷高準(zhǔn)確率。
該研究首創(chuàng)性地將因果推斷與大型語(yǔ)言模型相結(jié)合,提出了一種有效處理極端不平衡醫(yī)療數(shù)據(jù)的新范式,對(duì)于提升自動(dòng)化疾病診斷(尤其是罕見(jiàn)病)的準(zhǔn)確性與可解釋性具有重要意義。

CausalMedLM流程概覽