利用生物資訊解析腫瘤微環境異質性細胞之成份

本核心江士昇助研究員團隊目前建立利用生物資訊解析腫瘤微環境異質性細胞成份之分析流程。近期也將針對此類高通量資料之分析舉辦教育訓練,分享如何針對研究目的進行實驗設計,並使用適當的方法進行資料分析。

組織微環境中不同種類之組成細胞間的交互作用,一直是癌症研究與發育生物學研究重要的研究課題。以與癌症相關之腫瘤組織微環境為例,解析腫瘤組織樣本中的癌細胞、浸潤免疫細胞(tumor-infiltrating lymphocyte; TIL)及間質(stromal)細胞之樣態,可以用來預測免疫治療的反應,更甚者將有助益於新的免疫治療標靶的開發。而生物資訊學在這一領域的進展,恰好使我們有機會利用高通量基因表現資料來解決上述問題。目前已有的生物資訊學解析方法有兩類,第一類是利用全組織或以cell sorter粗分之多種細胞混合物為起始樣本,進行維陣列(microarray)或RNA-sequencing技術之全基因組表現分析,再以數學方法中如deconvolution等演算法解析細胞混合中各類組成細胞之含量。如以下說明為例,我們可以利用GEO (Gene Expression Omnibus)中所提供20人周邊血液之單核細胞樣本(peripheral blood mononuclear cell)以Illumina array技術所得的mRNA 基因表現資料,估計出6種細胞之含量,包括Naive B、Memory B、CD8+ T、CD4+ T、NK與Monocytes。此結果與此20樣本利用流式細胞儀分析所得到的相關性甚高(如下表):

Flow% (PBMC)
correlation Naive B Memory B CD8+ T CD4+ T NK Monocytes
Infiltration score Naive B 0.734 0.620 0.109 -0.232 -0.024 -0.392
Memory B 0.648 0.669 -0.268 -0.252 0.108 -0.098
CD8+ T -0.039 0.059 0.585 0.189 -0.089 -0.758
CD4+ T -0.367 -0.391 0.470 0.612 -0.379 -0.646
NK 0.153 0.295 -0.133 -0.403 0.693 0.133
Monocytes 0.212 0.254 -0.571 -0.451 0.211 0.669

此類的分析方法及套裝軟體已不下十種,且已被廣泛利用於公用基因表現資料庫如GEO或TCGA等之資料分析。

另一類的方法為單顆細胞(single cell)分析法,是先以微流體技術,將新鮮組織中的單顆細胞分離出,對每顆細胞都進行RNA-sequencing之基因表現分析,進而利用所有細胞之基因表現圖譜特徵,進行細胞分類及定量分析。本核心目前也已廣泛收集並建立single cell RNA-seq資料分析的流程(pipeline),可提供相關服務。上述二類方法各有優缺及限制,如何選擇與使用將在教育訓練中分享與說明。