結合臨床和放射組學特徵的演化學習預後預測模型

機器學習是人工智慧(AI)領域的重要分支,著重於訓練電腦從大量資料中學習數學模型和因果關聯性,並根據該分析做出最佳預測和輔助決策,並根據經驗改進推理模型,是智慧醫療不可或缺的研究學門。深度學習(deep learning)是機器學習的分支,是一種以人工神經網路為架構,對資料進行特徵學習的演算法。至今已有很多種深度學習的框架及其衍生模型,例如深度神經網路、卷積神經網路和深度置信網路等已被應用在電腦視覺、語音辨識、自然語言處理、音訊辨識與生物資訊學等領域,並有良好的成果,包括應用在醫學影像的電腦輔助偵測和診斷。深度學習方法常常被視為黑盒,對深度學習的主要批評是許多方法缺乏理論支撐,這些模型缺乏表達因果關係的手段,缺乏進行邏輯推理的方法,而且沒有具備整合專業知識的技術,因此極度依賴大量的訓練樣本。

早期肝細胞癌(hepatocellular carcinoma)患者是手術切除保留肝功能的理想治療候選者。然而,這些患者中有一半會復發癌症,並且尚未建立可靠的預後預測工具。肝細胞癌術後復發預測的臨床應用,其預測結果無法馬上獲得印證,因此AI模型預測結果的可解釋性就格外顯得重要。機器學習在預測早期肝細胞癌切除術後復發具有很高的應用價值,至今已有很多的預測模型,但考量到深度學習的黑盒以及專業領域知識嵌入不易的特性,目前沒有較可信賴的深度學習模型,目前大都是分別是使用放射組學影像特徵[1]或是臨床生化值特徵[2],或是合併使用[3]。

一項多機構研究增強電腦斷層(CT)的影像組學特徵預測早期肝細胞癌的複發[1],表明結果術前模型整合了放射組學特徵與血清甲胎蛋白水平和腫瘤數量;術後模型將微血管侵犯和衛星結節納入上述預測因素,兩個基於放射組學特徵的模型提供了更好的預測性能。使用臨床生化值特徵模型的研究,基於機器學習的預測模型的構建包括隨機生存森林(RSF)、梯度提昇機、彈性網絡回歸和Cox回歸模型等,RSF模型由白蛋白-膽紅素分級、血清甲胎蛋白、腫瘤個數、肝切除類型和微血管侵犯5個常用臨床生化值特徵組成,有較佳的預測準確性[2]。

本核心國立陽明交通大學生物資訊及系統生物研究所何信瑩教授研究團隊新近提出了一種新的演化學習(Evolutionary learning)衍生方法,稱為預測肝癌術後復發的基因演算法(GARSL),用於設計肝細胞癌術後2年內早期復發的臨床放射組學模型[3]。GARSL使用143個初始候選特徵,包括26個術前臨床生化值特徵、5個術後特徵和112個放射組學特徵(包含morphology, tumor edge, intensity, Haralick, moment, wavelet features)。GARSL最後以演化學習演算法選用41和17個特徵建立支持向量機(SVM)的術前和術後模型,實驗結果表明結合臨床和放射組組學特徵的 GARSL 模型顯著提高了預測 HCC 手術切除後早期復發的準確性,明顯優於其他知名的機器學習衍生模型和目前可用的臨床模型。何信瑩教授研究團隊研發「生醫演化學習平台:肝癌診療決策支援系統」並獲2021第18屆國家新創獎-學研新創獎。

本文對此演化學習目前提供生醫AI建模的研究服務做一簡介,演化學習主要採用智慧型演化式演算法對資料導向之機器學習做系統參數最佳化的預測系統,能夠在有限的訓練樣本中辨識一組最小生物標記(signature)及最高預測率的數學模型。基於演化學習及支持向量機/Cox回歸的預測模型有廣泛的應用,除了醫學影像的特徵擷取和辨識建立預測模型以外,例如在生物資訊的應用,辨識一組癌症轉錄體學生物標記集合的組合最佳化演算法(參見本核心News Letter 2019.02.15);在基因體學領域,在給定實驗的基因量測數據不充足時,能夠解決所導致的求解數學模型不唯一解的欠定問題(underdetermined problem),建構具有信心程度的仿真基因調控網路模型(News Letter 2020.02.15);在預測分析蛋白質功能方面,辨識一組胺基酸的物理化學特性,同時考慮預測準確性和特徵的機制分析,協助研究蛋白質體學的生物化學特性及未知蛋白質的功能預測(News Letter 2021.02.15)。TBI生物資訊核心團隊有分析各式多體學、高通量數據之經驗與統計專家,並定期分享研究成果及分析經驗,歡迎有需求的研究同好洽詢合作或服務。

參考文獻

[1] G-W Ji, F-P Zhu, Q Xu, K Wang, M-Y Wu, W-W Tang, X-C Li, X-H Wang, Radiomic Features at Contrast-enhanced CT Predict Recurrence in Early Stage Hepatocellular Carcinoma: A Multi-Institutional Study. Radiology 2020 Mar;294(3):568-579.

[2] G-W Ji, K Wang, Y-X Xia, X-C Li, X-H Wang, Application value of machine learning algorithms for predicting recurrence after resection of early-stage hepatocellular carcinoma, Online ahead of print, 2021 Aug 1;59(8):679-685.

[3] I-C Lee, J-Y Huang, T-C Chen, C-H Yen, N-C Chiu, H-E Hwang, J-G Huang, C-A Liu, G-Y Chaug R-C Lee, Y-P Hungh, Y Chao, S-Y Ho*, Y-H Huang*. Evolutionary Learning-Derived Clinical-Radiomic Models for Predicting Early Recurrence of Hepatocellular Carcinoma after Resection. Liver Cancer 2021;10:572–582. (IF=11.740).