E2
Taiwan Bioinformatics Institute

Home / Education / Tutorials / EMBOSS -> JEMBOSS User manual -> 序列擷取

Sequence retrieval using JEMBOSS
JEMBOSS 的 seqret 程式可用來自資料庫中取得所需的序列,在執行 seqret 程式前,可用 showdb 程式檢視系統資料庫。
showdb:列出資料庫清單
  go to : showdb。
按 GO。
檢視資料庫:國衛院收錄的 EMBL (DDBJ, GenBank) 核酸資料庫是每三個月更新一次,若要尋找最新的序列,建議利用 embldaily 核酸資料庫 (daily updated)。
seqret:自資料庫擷取序列
  seqret 操作步驟:
GoTo : seqret,按 enter ,JEMBOSS 將會切換到 seqret 的程式畫面。
 
輸入 "資料庫名稱:accession number / entry name" 於 Sequence Filename 的欄位中輸入資料庫的名稱與accession number (如:embl:m96160 )。如果不確定資料庫名稱的話,也可以由 Input Sequence Options 的選項進入,選擇合適的資料庫,接著並輸入序列 accession number或是 entry name即可。
按 GO 。
結果輸出:
  一般而言預設的序列輸出結果為 FASTA 格式,倘若無法擷取到序列時,可能為 accession number 出錯,可確定之後再試一次。
 
結果檢視:
  seqret 程式自資料庫中搜尋到序列之後,會跳出新視窗,顯示找到的序列內容。視窗上方會列出 "cmd", 即 command line的指令及參數,可以當參考。
存檔:
  找到的序列,可能會以序列名稱作為 output,而非一定以 accession number作為 output。儲存序列時,請點選 File 選項,並儲存於個人電腦之中,檔名記得自行更換,按'儲存'。
 
 
轉換序列格式:
    如果使用者需要將序列轉存為其他格式,可以點選 output section 的選項,選完將會跳出新視窗,並有一個 unspecified 的下拉式選單。使用者可從選單中選取合適的 output sequence format。其中包括 text, genbank, gcg, fasta等序列格式,以及多序列並列分析的格式如 msf, phylip, clustal 等。選擇適當的格式,按"確定",序列擷取的結果就會轉換為使用者需要的格式。
 
若對 seqret 程式之使用有任何問題,可以瀏覽使用說明:請點選 "GO" 按鈕旁的 "i" 按鈕,即會跳出說明網頁的視窗,請見下圖。