介紹癌症突變特徵資料庫 mSignatureDB

癌症是由DNA序列變化引起的遺傳性疾病。這些體細胞突變可由內生性因子(如:DNA修復缺陷,DNA胞苷脫氨酶活性)和外在因子(例如煙草、紫外線和有毒化學品)所引起。體細胞的染色體會累積損傷與修復過程所形成的傷疤,而這些傷疤分別由內在與外在突體因子所對應的突變特徵所造成,經累加、混合後保留在體細胞的基因體上。來自Wellcome Trust Sanger研究所的研究人員分析了從約一萬個檢體, 40種癌症類型解析出30種不同的突變特徵。其中有一半的突變特徵分別可以對應到外在或內在的突變因子,例如:煙草、紫外線、DNA修復酶缺失、DNA胞苷脫氨酶活性、中草藥馬兜鈴酸、黃麴毒素…等。突變特徵在癌症基因體研究屬於新穎的研究領域,需依賴Wellcome Trust Sanger所開發的 WTSI Mutational Signature Framework套件,並需有足夠的生物資訊能力才足以安裝設定並進行後續分析。

有鑑於此,本團隊長庚大學黃柏榕老師實驗室建置癌症突變特徵mSignatureDB (http://tardis.cgu.edu.tw/msignaturedb)。此資料庫收錄了涵蓋73個TCGA/ICGC癌症計畫15,780檢體的基因體突變數據,提供全球唯一且最完整的癌症突變特徵數據庫。除了整合TCGA/ICGC提供的臨床訊息,提供豐富的視覺化分析模組外。最重要的是開放使用者上傳癌症基因體突變圖譜到mSignatureDB資料庫與73個癌症突變特徵數據庫進行即時比較分析。幫助更多癌症基因體領域研究學者能更快加入這個新穎且快速發展的研究項目。

mSignatureDB是少數提供網頁操作介面的突變特徵分析工具。此外,不僅完整支援多種資料型態,如:TSV、MAF與VCF格式是其特色。結合臨床資料並自動產生精美分析圖表(如:Heatmap, Pie, Mutational Spectrum, Gene profile等)更是其獨特賣點。使用者僅需上傳基因體定序或全外顯子定序所得到的突變檔案即可進行自動化分析。分析結果也將在網站上保存三個月。

此資料庫已於2018年初發表於Nucleic Acids Research期刊Database Issue。