天士力數(shù)智中醫(yī)藥大模型文章入選高引用研究
近日,天士力數(shù)智中醫(yī)藥團(tuán)隊(duì)發(fā)表在國(guó)際權(quán)威期刊《美國(guó)醫(yī)學(xué)信息學(xué)協(xié)會(huì)雜志》的論文《Lingdan: enhancing encoding of traditional Chinese medicine knowledge for clinical reasoning tasks with large language models》,成為該刊近期被引用次數(shù)最多的文章之一,標(biāo)志著中醫(yī)智能化研究已獲國(guó)際學(xué)術(shù)界廣泛關(guān)注與認(rèn)可。


在全球大語(yǔ)言模型如ChatGPT等技術(shù)迅速發(fā)展的背景下,中醫(yī)古籍《黃帝內(nèi)經(jīng)》《本草綱目》等凝聚的千年智慧,卻因文言文表述、獨(dú)特理論體系與復(fù)雜語(yǔ)法,對(duì)現(xiàn)代AI構(gòu)成了顯著挑戰(zhàn)。如何讓前沿AI真正理解并運(yùn)用中醫(yī)知識(shí),成為關(guān)鍵研究問(wèn)題。
為此,數(shù)智中醫(yī)藥團(tuán)隊(duì)聯(lián)合北京交通大學(xué)醫(yī)學(xué)智能研究所的周雪忠教授團(tuán)隊(duì)深度合作,共同研發(fā)打造真正懂中醫(yī)、會(huì)辨證、能開(kāi)方的大型語(yǔ)言模型——靈丹(Lingdan),實(shí)現(xiàn)了在中醫(yī)臨床推理任務(wù)上的重要突破。
01
數(shù)據(jù)工程:構(gòu)建中醫(yī)知識(shí)新體系
研究團(tuán)隊(duì)構(gòu)建了三大核心數(shù)據(jù)集,為AI學(xué)習(xí)中醫(yī)奠定基礎(chǔ):
中醫(yī)預(yù)訓(xùn)練數(shù)據(jù)集(TCMPT):包含1.6億個(gè)詞元,涵蓋古籍、教材、病歷、藥典、藥品說(shuō)明書(shū)等多源知識(shí);
中成藥問(wèn)答數(shù)據(jù)集(TCPM Dialogue):通過(guò)“知識(shí)問(wèn)答化”技術(shù)生成20萬(wàn)組高質(zhì)量對(duì)話(huà),涵蓋主治,配伍等關(guān)鍵信息;
脾胃病處方推薦數(shù)據(jù)集(SSHPR):基于廣安門(mén)醫(yī)院的臨床診療數(shù)據(jù),包含3.9萬(wàn)條結(jié)構(gòu)化醫(yī)案,專(zhuān)注中醫(yī)處方智能推薦。
團(tuán)隊(duì)還創(chuàng)新性地提出了中醫(yī)交互式診斷對(duì)話(huà)框架(TCM-IDDF),基于思維鏈技術(shù)模擬真實(shí)診療流程。
02
三大模型:實(shí)現(xiàn)中醫(yī)AI的
“理、法、方、藥”全棧能力
基于高質(zhì)量數(shù)據(jù)集,團(tuán)隊(duì)研發(fā)了覆蓋不同場(chǎng)景的中醫(yī)AI模型系列:
靈丹預(yù)訓(xùn)練模型(Lingdan Pre-trained):在通用大模型基礎(chǔ)上注入中醫(yī)知識(shí),構(gòu)建底層理解能力;
靈丹中成藥對(duì)話(huà)模型(Lingdan-TCPM-Chat):支持多輪辨證與中成藥推薦;
靈丹處方推薦模型(Lingdan-PR):針對(duì)中醫(yī)處方推薦任場(chǎng)景優(yōu)化的專(zhuān)業(yè)模型。
測(cè)試顯示,處方推薦模型在Top@20 F1分?jǐn)?shù)上比最佳基線(xiàn)模型提升18.39%,展現(xiàn)出優(yōu)秀泛化能力。研究還發(fā)現(xiàn),通過(guò)隨機(jī)調(diào)整處方藥味順序進(jìn)行數(shù)據(jù)增強(qiáng),可顯著提升模型魯棒性、減少“AI幻覺(jué)”,體現(xiàn)了中醫(yī)“方有合群之妙用”的配伍智慧。
03
高引用背后:創(chuàng)新與實(shí)用的雙重突破
本論文獲得高頻引用,主要源于以下幾方面突破:
數(shù)據(jù)層面:與現(xiàn)有中醫(yī)AI數(shù)據(jù)集相比,靈丹數(shù)據(jù)集在數(shù)量和質(zhì)量上均超越以往模型。
方法創(chuàng)新:研究團(tuán)隊(duì)提出了知識(shí)語(yǔ)言化和知識(shí)問(wèn)答化等新方法,提升了中醫(yī)知識(shí)的結(jié)構(gòu)化表達(dá)與推理能力。
臨床實(shí)用性:模型可直接從病歷推薦處方,降低應(yīng)用門(mén)檻,更貼近實(shí)際場(chǎng)景。
跨領(lǐng)域價(jià)值:為其他專(zhuān)業(yè)領(lǐng)域的大語(yǔ)言模型應(yīng)用提供了可參考框架。
04
數(shù)智本草:賦能中醫(yī)藥垂直領(lǐng)域
目前,數(shù)智中醫(yī)藥團(tuán)隊(duì)已經(jīng)開(kāi)發(fā)了“計(jì)算+ 語(yǔ)言”雙模型的數(shù)智本草大模型,為中醫(yī)藥的智能化發(fā)展提供系統(tǒng)性解決方案。通過(guò)智能問(wèn)答、交互計(jì)算、文檔生成和智能應(yīng)用四種模式,為用戶(hù)提供從重要機(jī)制解析到中醫(yī)藥復(fù)方及組分創(chuàng)新開(kāi)發(fā)的全方位研發(fā)輔助。并涵蓋了數(shù)智中藥研發(fā)、中醫(yī)智能診療和中藥智能服務(wù)等多個(gè)場(chǎng)景。
作為“數(shù)智本草”大模型體系中的開(kāi)源版本,靈丹大模型不僅奠定了該系列堅(jiān)實(shí)的技術(shù)基礎(chǔ),更以開(kāi)放協(xié)同的生態(tài)架構(gòu),助力中醫(yī)藥領(lǐng)域共創(chuàng)智能未來(lái)。
05
展望未來(lái):開(kāi)啟中醫(yī)智能化的新篇章
目前,團(tuán)隊(duì)正在積極推進(jìn)靈丹2.0版的研發(fā)工作,致力于在模型規(guī)模、推理能力與臨床適配性上實(shí)現(xiàn)進(jìn)一步突破。
未來(lái),天士力數(shù)智中醫(yī)藥團(tuán)隊(duì)將繼續(xù)圍繞推進(jìn)模型多模態(tài)化、病種全覆蓋、臨床系統(tǒng)驗(yàn)證等方向深化研究,推動(dòng)構(gòu)建“理、法、方、藥”一體化的智能輔助診療系統(tǒng),真正成為中醫(yī)傳承與創(chuàng)新的數(shù)字化伙伴。
【特別聲明:部分文字及圖片來(lái)源于網(wǎng)絡(luò),僅供學(xué)習(xí)和交流使用,不具有任何商業(yè)用途,其目的在于傳遞更多的信息,并不代表本平臺(tái)贊同其觀點(diǎn)。版權(quán)歸原作者所有,如涉版權(quán)或來(lái)源標(biāo)注有誤,請(qǐng)及時(shí)和我們?nèi)〉寐?lián)系,我們將迅速處理,謝謝!】
關(guān)于 天士力其他文章
- 市數(shù)據(jù)局專(zhuān)班赴天士力數(shù)智調(diào)研 共繪新圖景
- AI賦能中藥領(lǐng)域創(chuàng)新 天士力交出硬核答卷
- 天士力|《普洱茶感官風(fēng)味輪》團(tuán)體標(biāo)準(zhǔn)發(fā)布
- 天士力數(shù)智本草大模型通過(guò)國(guó)家級(jí)備案認(rèn)證
- 天士力公益支教 為茅臺(tái)鎮(zhèn)孩子播撒溫暖與希
- 天士力降茶完成國(guó)內(nèi)首個(gè)無(wú)糖茶人體試驗(yàn)
- 天士力攜大健康產(chǎn)品亮相ESG中國(guó)?創(chuàng)新年
- 天士力降茶亮相2025南京全國(guó)秋季糖酒會(huì)












