E2
Taiwan Bioinformatics Institute

Home / Help / FAQ

其他生物資訊常見問題
  1. 為什麼要用GCG--GCG程式套組與網路資源的比較
  2. 如何使用 blast 搜尋最新的 database ?
  3. 如何列印圖形 ?
  4. 如何將資料由 GCG 主機中下載下來 ?
  5. 無法進入 SeqWeb ?

1. 為什麼要用GCG--GCG程式套組與網路資源的比較

作者: 楊永正 博士
簡介 - GCG 程式套組與網路資源的比較

使用 Internet 上的資源,最大的好處就是資料庫更新的頻率高。此外資料庫間的連結也做的比較好,例如Entrez 系統不但可在序列資料庫間連結,更可連到文獻資料庫 Medline,或是反過來由文獻資料連到序列資料。可是只有資料庫是不夠的,許多全球資訊網的資源還可做序列分析。它們給人的印象是好學易用,而且圖形介面設計精美,讓人賞心悅目,他們的功能可能還比市售的程式更好,所以我們不禁要問,為什麼要學程式套組,而不學網際網路上的資源? 問題是即使像在網路上有「生物工作台(Biology workbench)」這樣受歡迎的序列分析工具,也無法提供像一般程式套組這樣完整的功能。若想完成一些較複雜的工作,就必須連到多個不同的站台去,這時就產生了格式互換的問題。這是因為電腦程式一旦寫出,輸入與輸出的格式就被限制。因此除非經特別的整合,一個電腦程式的輸出檔案可能無法直接輸入另一些電腦程式。而不同的資料庫也有不同的儲存格式,沒有一個電腦程式是能讀取所有資料庫的資料的,這時就產生了格式互換的需求。使用者必須花些精力在處理輸入的格式,初學者若分心去處理這些格式問題,將無法集中心思在解決生物學的問題。即使沒有格式互換的問題,你仍必須先由資料庫中取出序列,存到你的電腦上,再將其傳到另一站台上做分析。在網路通暢時不需花太多時間,可是在使用者多時,分析的速度就受到影響。此外,有一些功能,尤其是以圖形顯示結果的程式,在網路上通常不容易找到。 市售的程式解決這個問題的方式是寫一幾乎含有所有的功能的程式套組,這樣在套組內的所有計算就不會有格式互換的問題。同時,資料庫也附在套組內,所以從查閱資料庫開始,到得到分析結果都不會有格式互換的問題發生。因為每一套組都是這樣設計的,從哪一種套組開始學習其實都可以,重要的是要學的紮實。比較知名的幾種套組包括 IG suite、GCG、PC/GENE、GeneWorks。前二者是安裝在工作站電腦上的,可經由網路連線使用,計算能力比較強;後二者則分別是 PC 與 Mac 環境下的套組,速度雖然慢但使用較方便且較易使用。 可是沒有一個套組是萬能的,以功能較強的 IG Suite 與 GCG 兩個套組而言,IG Suite 使用起來比 GCG 容易,而且在資料的搜尋、序列之獲取及分子中模組結構之尋找等功能上均比 GCG 好,但是支持援圖形顯示的程式比 GCG 套組少。此外,像 RNA 二級結構分析,親緣關係分析等功能則根本不提供。對於使用熟練的使用者而言, GCG 套組中的程式可利用指令方式執行,因此便於自動化;而 IG Suite 的環境中則必須做互動式之操作,非常耗時。在本課程中,我們將介紹高速電算中心的 GCG 套組第九版,並以實例說明各程式的應用場合。 在另一方面,網路上的序列分析使用的參數預設值(default),並不見得是最佳的條件。因此在分析某些序列時可得到好的結果,應用到其他序列上時可能就不是很理想,這是使用者使用時必須瞭解的。而且因為網路上的資源的提供者,並不提供使用者任何訓練或諮詢服務,有關輸出結果的解讀必須查閱原始文獻,對許多使用者而言,讀這些文獻是非常困難的。相反的,使用套組不但可以調整程式中的參數,以找尋最佳的條件,更提供使用者訓練與諮詢服務。因此若想瞭解如何解讀輸出的結果,程式的前提與使用範圍程式是一個比較好的方法。 對需要做大量分析的人而言,程式套組更優於網路上的資源。因為只要熟悉 UNIX 這作業環境與套組的功能,就可將分析自動化。而網路上的資源為了安全上的考量,通常不讓使用者以指令控制程式的執行,所以無法自動化。此外,有一些分析是網路上的資源不可能做的,例如你若希望用自己的序列搜尋一個自己的資料庫,檢視資料庫中的序列是否含有一個自己發展的模組樣式(pattern) 等。 總之,如果你不是經常做序列分析,或是只用到序列分析中某幾種功能,使用網路資源是一個很好的選擇;可是如果要做較複雜。較深入的分析,或是做經常性的分析,那麼使用程式套組會比使用網路資源方便。

2. 如何使用 blast 搜尋最新的 database ?

使用 GCG 的 blast 程式時 , 所搜尋的 database 可分為兩大類 ,一類是 remote database ( 選 項 1 - 19 ) , 通常只要選擇這類的 database , GCG 程式會自動連接至美國的 NCBI , 直接比對最 update 的序列 。另外一類為 local database ( 選 項 20 - 25 ) 則是指裝設在主機中的 database , 這個 database 目前是每兩個月update 一次 的 。但是在最新版的 blast 程式 , 您可能會發現 , 若是您使用 remote database , 就會出現下列 Error Message : Fatal Error from Server: FATAL: blastd.REAL: permission denied to IP address 140.111.200.14 EXIT CODE 1 END 因為現在 GCG 的 blast 已經沒有搜尋 remote database 的功能 , 而只能就 local database 做搜尋 , 所以您就只 能選擇選項 20 - 25 。若是想要 blast remote database , 則可以用 netblast 這個指令 , 就不會有任 何 問 題了。

3. 如何列印圖形 ?

請在執行與圖形相關的程式 ( 如 frames )之前 , 先設定好圖形輸出的方式 ,有下列兩種方式:(注意 ! 圖形設定一次只能有一種方式 ) X-windows : 先 執 行 X-windows 的 程 式 , 如 X demo32 (下 載 1787 K ) 然 後 於GCG 主 機 畫 面 中 鍵 入 : gcg 1% setenv display xxx.xxx.xxx.xxx:0.0 { 其 中 xxx.xxx.xxx.xxx 為 您 的 電 腦 的 IP address } gcg 2% xwindows 再選 Color Workstation , 即完成設定 。 之後再執行繪圖的程式 ( 如 frames) , 所得的圖形就會直接顯示在 X-window 的視窗中 。 但是只能顯示 , 除非所使用的 x-windows 程式可執行列印 , 否則如 X domo32 就無法直接列印圖形 。 gif 或 postscript : gcg 1% gif Use which GIF version: GIF87a GIF89a Please choose one ( * GIF89a * ) { 用 預 設 值 } Enter GIF89a output filename (* /dev/tty15 *) $program$.gif 此後再執行圖形程式時 , 會自動將圖 形檔以 { 程 式 名 }.gif 的方式輸出並存到您在 GCG 主機的目錄下 。 例如使用 frames , 則輸出的檔案會是 frames.gif 。 但若重覆執行 , 則舊的檔案會自動被新檔案取代之。 若要列印此圖形檔 , 則可利用檔案傳輸方式 , 將此圖形檔下載至您的電腦中 , 再以個人電腦中的繪圖程式顯示或列印此圖形 ( gif 可以使用瀏覽器開啟 ) 。 除 了 gif 外 , GCG 中 還 有 一 個 指 令 postscript, 使 用 方 法 與 gif 類 似 , 但 輸 出檔 名 為 $program$.ps, 並 且 要 用 GS View ( http://www.cs.wisc.edu/~ghost/)來 列 印。  

4. 如何將資料由 GCG 主機中下載下來 ?

請使用檔案傳輸軟體 , 如 WS-FTP ( 下 載 481K ), 並使用您現在的 GCG 的username 及 passwd 即可進入您自己的目錄區,再選擇想下載的檔案 , 文字檔及 .ps 的圖形檔 ASCII Mode 傳輸 , 圖形檔 (.gif) 以 Binary Mode 傳輸即可 。  

5. 無 法 進 入 SeqWeb ?

首先您必須先有國家衛生研究院的 GCG 帳號 ( 帳號申請 ),再由國衛院資訊組幫您設定進入 SeqWeb 的密碼,如果還是進不去,可能的狀況有 : Netscape 或 Internet Explorer 版本不對, 必須為 4.04 以上版本 。 而且, 使用Netscape 會比 Internet Explorer 適合。可以試著將瀏覽器中的 cache 檔案清除後,再試一次 。 使用 SeqWeb 時, 請將 proxy server之設定去除 。 

問題諮詢:
  請洽 NHRI 生醫資源中心 (電話:037-206166#33621)