利用信息技術(shù)打造中醫(yī)術(shù)語加工平臺
來源:新浪網(wǎng)發(fā)布時間:2013-06-01
劉保延發(fā)表演講
有關(guān)術(shù)語的標準研究在20世紀30年代就有很大進展,60年代在美國、蘇聯(lián)等國家形成獨立的研究領(lǐng)域,90年代以后進入活躍的發(fā)展時期。一種語言的普通詞匯的數(shù)量大約有十多萬個,專業(yè)詞匯的數(shù)量要大得多,比如說化學學科的專業(yè)詞匯有三百多萬個。每過25年,科學學科術(shù)語的數(shù)量就要翻番。
1985年,我國成立了全國術(shù)語標準化技術(shù)委員會。2006年,各專業(yè)領(lǐng)域已制定術(shù)語標準約48萬條。目前國外已經(jīng)形成權(quán)威的醫(yī)學標準,分為語義的標準和語法的標準。中醫(yī)藥學的發(fā)展已經(jīng)有2000多年,中藥的術(shù)語也是非常之多,但中醫(yī)在標準化和規(guī)范化方面做的工作遠不能滿足信息化及中醫(yī)藥學發(fā)展的需求。目前,文獻里面的中醫(yī)藥名詞超過60萬,但標準術(shù)語不足5%。利用信息手段對中醫(yī)藥進行研究,已經(jīng)成為中藥學發(fā)展的重要任務(wù)。
世界衛(wèi)生組織近幾年對傳統(tǒng)醫(yī)學術(shù)語也加快了研究速度,世界上已經(jīng)有100多個國家使用針灸,使用中醫(yī)中藥。在醫(yī)療的體系當中,肯定會涉及到有關(guān)中醫(yī)藥的術(shù)語問題,這個術(shù)語到底怎么運用,怎么標準化、規(guī)范化,也成為其他國家醫(yī)學界必須解決的一個問題,2005年,在國家自然基金的資助下,中醫(yī)藥學委員會公布了中藥學5000多個基本名詞。中醫(yī)基礎(chǔ)理論術(shù)語已經(jīng)成為國家標準,最近要開始實施,它收入1130條術(shù)語。
中國中醫(yī)科學院于1987年開始研究中國中醫(yī)藥學主題詞表,近幾年主要在做三方面的工作。一是借鑒國際上統(tǒng)一醫(yī)學語言這個系統(tǒng)研究的思路和方法,做了一個中醫(yī)藥學語言系統(tǒng)。二是在中醫(yī)臨床標準術(shù)語集方面也做了一些工作。三是把上述兩者結(jié)合到中醫(yī)藥的臨床研究和電子病歷的實施當中。
我們的主要目標,是充分利用現(xiàn)代信息手段,對中醫(yī)藥所發(fā)現(xiàn)的人體現(xiàn)象、規(guī)律與相關(guān)物質(zhì)進行重現(xiàn)與認識,形成各種類別的數(shù)據(jù)庫,利用數(shù)據(jù)統(tǒng)計、數(shù)據(jù)挖掘等方法,對中醫(yī)藥學進行整體和動態(tài)個體化的研究。
我們以中藥學的特點為基礎(chǔ),請中藥學專家、語言學專家、信息學專家共同研究中醫(yī)術(shù)語標準,再借鑒國外醫(yī)學標準的先進模式和思路,組織全國中醫(yī)藥科研機構(gòu)和高等院校,分別進行中醫(yī)藥學語言系統(tǒng)、中醫(yī)藥臨床術(shù)語集、中醫(yī)臨床術(shù)語編碼系統(tǒng)的研究。
我們希望遵循中醫(yī)藥學的語言特點,引進和改造美國統(tǒng)一醫(yī)學語言系統(tǒng)的方法,建立中國第一個計算機化的中醫(yī)藥學與相關(guān)學科的檢索語言集成系統(tǒng)。主要分四個步驟來做的首先搞一個系統(tǒng)總體設(shè)計,第二建立數(shù)據(jù)加工平臺,第三建立語用關(guān)系醫(yī)藥庫,第四建立檢索平臺。
要做這一件事情,靠一個單位幾個人是完不成的,全國有13家大學和研究機構(gòu)100多位專家參與這項工作。還有一個專門的小組,就是中國中醫(yī)科學院的信息所,專門建立了一個中醫(yī)藥學語言系統(tǒng)中心,負責組織實施。
這個工作從2002年開始,到目前為止,我們基本上就把中醫(yī)藥常見的60多萬個詞匯收入其中,加工了10萬個概念及完全語義關(guān)聯(lián)40萬條,在此基礎(chǔ)上出版了一套《中國中醫(yī)藥學術(shù)語集成》9本術(shù)語集。
我們做的另外一項工作,是在三四年以前就開始采集中醫(yī)臨床數(shù)據(jù),作為評價體系的研究參考。這里面涉及到的臨床數(shù)據(jù)采集,相當于臨床電子病歷,也就是中醫(yī)藥的電子病歷研究,它涉及到術(shù)語的標準化和規(guī)范化。
我們把臨床當中的術(shù)語分為六大類,為這些術(shù)語提供編碼的規(guī)則和方法,同時我們也做了一個加工術(shù)語的平臺,每一個術(shù)語的性質(zhì),每一個術(shù)語所涉及的內(nèi)容,全部由這個平臺加工出來。我們將把這些數(shù)據(jù)快速錄入到系統(tǒng)里來,為下一步的規(guī)范化利用奠定基礎(chǔ)。