電子病歷去識別化平台建立

隨著醫療技術的普及與不曾間斷的醫療需求,電子化的病歷文本數量正不斷的高速累積,病歷資料中除了記載醫病隱私等敏感資料,同時記錄著針對各類疾病所衍生的症狀、醫囑、處方、檢驗報告等等珍貴資訊。若這些資料因為資訊安全考量而僅作為當次醫療紀錄儲存使用,無疑是相當可惜的;因此,為了活化資料的利用,令病歷文本中隱含的知識能普適性地應用至未來的疾病案例藉此提供幫助,遮罩病歷中的個人化資訊,使提取臨床應用知識的同時不致隱私外流是相當重要的步驟。病歷資料的去識別化技術即是為此需求而探討的課題。

本核心設施亞洲大學許聞廉教授研究團隊藉由已過往開發之『統計式準則方法』,又稱Statistical Principle-based Approach (SPBA),整合病歷隱私相關知識進行應用系統建立,與中國醫學大學附設醫院進行合作,在七千篇來自不同科室報告的病歷文本中進行六項隱私資訊的識讀,能達到普遍高於九成的辨識率,具體效果如表一所示。為了能確實將該系統落地應用於臨床場域,團隊擴展系統可去識別之判讀項目至十二項,並同時建立如圖一之使用者介面,供臨床人員運用該去識別化平台。經過系統識別之隱私資訊會以標籤遮罩方式呈現,確保個人資料安全,圖二所示即為系統判讀原始資料後產生去識別化報告的成果。目前該系統已初具雛形,期待未來能落實應用於各大醫院中,並能根據個別需求進行調整及改善,協助臨床研究的發展。


表一、病歷隱私資訊系統辨識表現

  


圖一、去識別化系統之使用者介面呈現示意圖

  


圖二、實際去識別效果呈現