亞洲健康互聯
優化產業的推手,生醫商機的GPS!

首頁最新消息產業觀測站基於Access的大規模住院病案首頁資料採擷

基於Access的大規模住院病案首頁資料採擷

來源 : 中國醫療設備 2017第10期
update : 2017/11/29
引言
 
如今是一個資料共用化、智慧化的時代,因此出現了爆炸性增長的“大資料”。大資料的應用首當其衝的就是智慧醫療,具體可應用在臨床診斷、遠端監控、藥品研發、防止醫療詐騙等方面。研究表明,大資料即將到達期望膨脹期,能夠在5~10年的時間裡達到一個成熟的階段進而穩步發展直至變為實際生產力。在醫療衛生領域,目前國內醫院資訊化建設不斷完善,經過不斷積累,各種形式的電子化醫療系統產生了體量龐大的醫療大資料,它們成為生成醫學證據的巨大來源。
 
住院病案首頁是目前標準化程度最高、最易於挖掘、具有很高價值的一類醫療大資料。對連續多年、覆蓋某一地區所有醫院的住院病案首頁資料進行分析,可以瞭解該地區某一病種患者住院天數、住院費用、再住院率等的變化趨勢,為衛生和醫院主管部門在醫療衛生資源配置、醫院管理決策、流行病學監測、衛生經濟學等方面提供重要資訊。但是,由於存在資料量巨大、疾病編碼複雜且不一致、資料品質參差不齊等問題,在對海量住院病案首頁進行分析時仍然存在很多困難。針對這些問題,我們在Access資料庫中程式設計實現了資料清理、疾病編碼轉換、住院指標統計,並以慢性阻塞性肺疾病為例進行了統計分析,取得了滿意的效果。
 
1 材料與方法
 
1.1 資料來源
 
收集某市2002~2013年所有二級及以上醫院的住院病案首頁資料,共約600萬條記錄,按年度存儲在Access數據庫中。提取病案首頁中患者的病案號、性別、出生日期、入院時間、出院時間、住院天數、出院主要診斷、出院其他診斷、住院費用等資訊用於本研究。
 
1.2 資料預處理
 
資料預處理分為資料清理和疾病編碼轉換兩部分。
 
(1)資料清理。透過對欄位排序,發現異常的年齡值(如>150歲)、出生日期(如1878年3月15日)、住院費用(如<10元),並剔除相應記錄;利用入院時間和出生日期得到住院時的年齡,利用出院時間和入院時間得到住院天數,如果計算結果與記錄中保存的資料相差較大,則認為該條記錄可靠性差,予以剔除。對由於首位為數位0造成的同一患者病案號不同的情況,補足所有病案號的前置0,減少由此造成的無法識別多次入院的同一患者的問題。
 
(2)疾病編碼轉換。現在通用的疾病編碼為國際疾病分類(International Classification of Diseases,ICD)編碼,是WHO制定的國際統一的疾病分類方法,它根據疾病的病因、病理、臨床表現和解剖位置等特性,將疾病分門別類,使其成為一個有序的組合,並用編碼的方法來表示的系統,現通用ICD-10疾病編碼。由於ICD-10編碼龐大、過於細緻,不利於進行病種統計,因此我們採用了目前在國外已有較多應用的臨床分類軟體(Clinical Classifications Software,CCS)編碼體系。它根據ICD-10編碼將疾病歸為259種,為診斷和手術分類提供了便利。我們在Access中程式設計實現了ICD-10編碼到CCS編碼的轉換。
 
1.3 程式設計匯總住院指標
 
在Access中,利用表單和VBA技術,按年度對住院病案首頁資料進行匯總分析。匯總指標包括因以CCS編碼表示的指定病種D(在本文D表示本研究所選取的示例慢性阻塞性肺疾病)住院的患者人數、平均住院天數、平均住院費用、出院後30d再住院率。所有指標均按照性別(男和女)、年齡段(0~17、18~35、36~60以及60歲以上分層計算。計算30d再住院率時,還區分以病種D為出院主要診斷的再住院、病種D為出院其他診斷的再住院,以及出院主要及其他診斷中均無病種D的再住院這3種情況。
 
計算30d再住院率是此次軟體編制過程中的難點。需要提取以病種D為出院主要診斷的患者的病案號,並根據病案號回溯這些患者所有的再住院情況,並判斷與上次因病種D住院的時間間隔是否在30d以內。
 
2 結果
 
在聯想伺服器ThinkServer上運行程式,伺服器的基本配置為兩顆Intel® Xeon E5六核(主頻2.4GHz)CPU、64GB記憶體、4塊2TB硬碟,Windows8作業系統,Microsoft® Access 2016。
 
慢阻肺的CCS編碼為127,對應的ICD-10編碼為J40-J44以及J47。以2004年為例,共有316105條記錄,程式運行用時7s,結果見圖1。


 
從2004年的統計結果可以看出,在所有出院主要診斷為慢阻肺的患者中,男性患者明顯多於女性患者(3262:2273),60歲以上患者為4201人次,所占比例最大(76%);平均住院天數為12.8d,平均住院費用為4761元,出院後30d內因慢阻肺再次住院的發生率為4.28%。
 
圖2~5展示了2002~2013年出院主要診斷為慢阻肺的患者的住院人次、平均住院費用、平均住院天數及30d再住院率的變化趨勢。
 



3 討論
 
目前,慢阻肺每年導致死亡的人數超過100萬,已成為中國城市人口的第四大殺手。中國慢阻肺患者達4300萬,40歲以上人群的發病率已上升為8.2%,其中男性患病率達12.4%。隨著人口總數的增加、吸煙人群的擴大以及空氣污染的加重,因慢阻肺住院的患者數逐年增加。平均住院費用總體呈上升趨勢,從2002年的4096元逐年上升到2013年的9384元,與何權瀛等調查723例慢阻肺患者後報告的8755元(2006年)基本一致。隨著醫療水準的提高,平均住院天數總體呈下降趨勢,從2002年14d的逐年遞減到2013年的11d,與關麗嬋等報告的12.04d(2008~2014年)基本一致。60歲以上患者的平均住院天數與平均住院費用總體來說普遍高於其他年齡段。出院後30d內因慢阻肺再次住院的患者比例總體呈上升趨勢,特別是在36歲以上的中老年患者中。這些基於大規模住院病案首頁資料的分析結果,既與多數小規模臨床調查結果相一致,又提供了10多年間的變化趨勢,為今後的臨床診療和醫院管理提供了有益的參考。
 
本研究編制的住院指標統計分析軟體,介面簡潔,結果顯示清晰明瞭,運行情況良好。對近593萬條記錄進行分析累計運行267s,基本滿足海量資料分析的速度要求,說明瞭進行大規模住院病案首頁資料分析的可行性和可操作性。我們將在今後的研究中增加更多的統計分析功能,如提供中文病種名稱下拉清單供用戶選擇,可以保存年度分析結果,直接得到各種分析曲線圖,對時間趨勢進行統計分析等。此外,利用住院病案首頁所能提供的資訊(患者基本信息、住院醫療與診斷資訊、住院費用資訊),對病案首頁數據進行更深入的挖掘,以獲得更多、更有價值的知識,充分發揮住院病案首頁資料在臨床決策、管理決策中的作用。