|
癌症基因體大數據分析:
隨著高通量定序(Next-Generation Sequencing, NGS)技術的成熟,癌症研究已全面進入大數據時代。研究者不再僅關注單一基因或單一突變,而是需要能夠整合並解析大量體細胞突變資料,從中萃取具有研究與臨床意義的關鍵資訊。然而,若缺乏合適的分析工具與工作流程,龐大的癌症基因體資料往往僅停留在資料層次,難以有效轉化為可解釋、可應用的知識。 在基因體研究中,科學家常需要整理並分析突變資料。Mutation Annotation Format (MAF) 就是一種專門用來記錄基因突變資訊的檔案格式。MAF的形式是一個「表格型文字檔」,每一列代表一個突變事件,每一欄則描述該突變的不同屬性。MAF 的來源通常是VCF檔案(Variant Call Format)。VCF包含非常詳細的突變資訊,但有時過於複雜,像是同一個突變可能在不同轉錄本上都被記錄。為了讓研究更方便,MAF會把這些資料「整理成摘要」,只保留最重要的部分,讓研究人員能更快、更有效率地分析癌症或其他疾病的突變模式。maftools 是一個R語言套件,專門設計來讀取並處理MAF檔案,可幫助研究人員快速進行統計分析與視覺化,更直觀地理解癌症基因體的突變特徵。
本課程以TCGA 資料庫與 Maftools 為核心,進行癌症體細胞突變資料分析,特別規劃一條分析能力清楚銜接、但實際操作門檻逐步降低的學習路徑,引導學員理解不同分析模式在研究流程中的角色與適用情境,而非僅學習單一工具的操作。 課程首先從門檻較高、但最具彈性與可控性的指令式分析出發,透過 R 語言與 maftools 進行癌症突變資料的註解、統計分析與視覺化,協助學員建立對癌症基因體資料格式、分析流程與統計意義的完整理解。此階段著重於「理解分析邏輯與資料結構」,讓學員掌握分析的核心原理,而非僅產生結果。 在此基礎上,課程將進一步介紹並實際操作現有成熟的圖形化介面(GUI)分析工具,示範如何在已理解分析概念的前提下,以更直覺、低門檻的方式完成常見的突變資料探索與視覺化分析。學員將學習在實務研究中,如何有效運用 GUI 工具提升分析效率,同時理解其背後所對應的分析流程與限制。 最後,課程將引入最新的 LLM(大型語言模型)輔助分析架構(Maftools-MCP),展示癌症基因體分析在 AI 輔助下的全新工作模式。透過自然語言描述分析需求,系統可將研究者的意圖轉譯為可追溯、可重現的實際計算流程,進一步降低分析操作門檻,同時維持分析過程的透明性與可信度。學員將實際體驗 AI 如何作為研究流程中的智慧助理,協助分析設計、結果探索與視覺化呈現,而非取代研究者本身的專業判斷。 本課程強調實作導向與視覺化成果呈現,引導學員實際操作癌症基因體資料分析、解讀分析結果並產出高品質圖表,培養將癌症基因體大數據轉化為可解釋、可應用研究證據的能力,為後續投入癌症研究、精準醫療與相關臨床應用奠定穩固基礎。 課程亮點:
2026年1月28日(星期三)
|
||||||||||||||||||||
