根據突變表型資料開發功能性基因體富集分析工具


Meng-Pin Weng and Ben-Yang Liao*, modPhEA: model organism Phenotype Enrichment Analysis of eukaryotic gene sets. Bioinformatics 33, 3505-3507 (2017).

近代生物學及生物醫學研究中,高通量分析分析技術(如生物晶片或次世代定序等)的使用已不可或缺。這些研究所產出的初步結果常以基因群(gene sets)的方式呈現。為詮釋基因群背後的生物意義,富集分析(enrichment analysis)已成為後基因體時代研究不可或缺的一部分。目前提供富集分析服務的生物資訊工具普遍仰賴GO (Gene Ontology) terms或KEGG pathways等基因功能註解;而這些註解所著重的”基因功能”往往著重於分子及細胞層面,因此相關的分析的結果無法反映基因群在個體發育、形態、生理及行為中所扮演的角色。

為突破上述限制,E2生技醫藥生物資訊核心設施熊昭研究員計畫下之廖本揚研究員團隊發展一名稱為modPhEA(簡稱於model organism Phenotype Enrichment Analysis)的生物資訊分析工具。此工具所整合的基因功能資料庫源於基因在遺傳學操作(genetic manipulations)後所產生的表型(phenotypes)資料,因此能彌補既有工具的不足,為使用者提供所輸入之基因群所對應的個體生理、型態、行為以及疾病等特徵。相較於常規的富集分析工具,modPhEA具有下列特色: (1)六種常用模式生物(包含人、小家鼠、斑馬魚、線蟲、果蠅以及酵母菌)表型資料庫的整合,使使用者能夠根據研究對象的最鄰近物種的表型資料進行分析;(2)同源基因(orthologs)資料庫的建立,使modPhEA能夠分析來自於182個動物或真菌中任何一物種的基因群;(3)允許使用者對表型資料的來源進行過濾或選擇,以控制不同實驗方法所可能產生的誤差;(4)允許使用者自行定義表型,對複雜性狀及疾病進行研究;(5)同時提供使用者表列式及階層式的輸出結果,兼顧使用者論文撰寫時不同的需求。

modPhEA能夠廣泛應用於基礎生物學及生物醫學研究。生物醫學方面,modPhEA成功預測茲卡(Zika)病毒感染病患的臨床表徵,除顱骨、神經等發育異常(小腦症)以外,所預測的新生兒四肢異常性狀,被最近的文獻所支持。另外,modPhEA也成功預測腸道菌異常(dysbiosys)時,宿主代謝、型態及行為的異常表徵。其在複雜疾病的應用,証實特定基因群調控的變化會造成巨細胞血管炎giant cell arteritis (GCA)。modPhEA免費開放給全球生物學及生物醫學研究人員使用, modPhEA的網址為: http://evol.nhri.org.tw/modPhEA/