E2
Taiwan Bioinformatics Institute

Home / Education / Tutorials / EMBOSS -> EMBOSS User manual

Command Mode EMBOSS 簡介及基本操作

Command mode EMBOSS 安裝於 Unix 主機裡,若使用者要利用 Command mode EMBOSS 分析序列,必須先登入主機,並以下指令之方式啟動程式,進行分析工作。常見 Unix 指令請參考 常用Unix指令表 網頁說明。

在使用 EMBOSS 時首先要注意的就是,因 Unix 主機和個人電腦的不同,而使用者若想使用EMBOSS 的程式來分析自己的序列時,首先就必須先以 Telnet 軟體建立個人電腦及主機間的連線,若需進行檔案傳輸時再以 FTP 軟體將個人的序列檔上傳或分析結果下載到個人電腦中進行列印,一些 command mode 常用工具請參考 常見軟體下載

 
  功 能 程 式
  與EMBOSS主機連線 (Telnet) Netterm
  檔案傳輸 (FTP) WS-FTP、Cute FTP
  由螢幕上查看主機的分析結果圖形 Xwindow (Xwin32、Exceed)
  於個人電腦中觀看、修改或列印圖形 Internet Explorer, ACDSee, Photoshop等 (for png file)
GS-Tools、Corel Draw、PhotoShop (for ps file)
 
 
注意事項:
    利用 ftp 軟體上傳或下載存放於自己電腦或 Server 中的序列檔案時,使用者必須注意序列檔案格式,純文字格式 (多命名為 .txt, .seq, .pep, .dat, .fasta, .list, .msf ...... 等附檔名) 以及 postscript (如 .ps 副檔名) 的檔案, 必須以 ascii 模式上傳和下載;若是圖片類 (如 .png, .gif...... ) 檔案,則必須以 binary 模式上傳及下載。
Command mode EMBOSS 基本操作:
  連線至EMBOSS主機:
> telnet bioinfo.nhri.org.tw   (以 telnet 方式連上主機)
> login: xxxxxx (please enter your user account)
> password: yyyyyy (please enter your password)
註: xxxxxx 為 user 申請 bioinfo.nhri.org.tw 的帳號,yyyyyy 為帳號的密碼。
當使用者連接上主機之後,會出現 "Welcome to the WISCONSIN PACKAGE" 以及程式與各資料庫版本的說明,請不用擔心連接錯主機,因為國家衛生研究院已經將 Command mode GCG 和 Command mode EMBOSS 兩者整合在同一主機上,因此登入成功後不但可以使用 GCG,同時也可以使用EMBOSS,敬請放心。
接著,只要輸入EMBOSS 的程式名稱,就可以開始進行序列分析工作了。如果對程式不了解,可以於程式名稱後加上 -help 之參數;若要讓程式依照各項步驟執行,則加上 -opt 的參數 (代表 option 之意) 即可。

如: > seqret -opt   (執行 seqret 程式並依照各項步驟進行)

   > wossname -help   (查看 wossname 指令之說明)

 
使用範例 (以下黑色字為電腦敘述,紅色字為輸入的命令):
  Command mode EMBOSS 使用的第一個程式-- wossname (列出與查看程式名稱)
 

unix % wossname
Finds programs by keywords in their one-line documentation
Keyword to search for, or blank to list all programs: protein
SEARCH FOR 'PROTEIN'  (*以下即為列出之結果)

antigenic Finds antigenic sites in proteins
backtranseq Back translate a protein sequence
charge Protein charge plot
...........................
topo Draws an image of a transmembrane protein
tranalign Align nucleic coding regions given the aligned proteins

當結果出現之後,使用者就可以參考程式名稱後方的敘述,並選擇合適的程式使用。
由EMBOSS讀入、輸出以及擷取序列-- seqret
 

unix % seqret
Reads and writes (returns) a sequence
Input sequence: embl:xlrhodop (*此處輸入序列名,輸入 accession number 亦可)
Output sequence [xlrhodop.fasta]:
(*在此會先詢問 user 是否以此檔名輸出,同意按 enter 即可,也可自行輸入)

unix % more xlrhodop.fasta
>XLRHODOP L07770 Xenopus laevis rhodopsin mRNA, complete cds.
ggtagaacagcttcagttgggatcacaggcttctagggatcctttgggcaaaaaagaaac
acagaaggcattctttctatacaagaaaggactttatagagctgctaccatgaacggaac
...............................

(*以 more 指令看 xlrhodop.fasta 序列內容)

  雙序列比對程式 -- dottup
 

 

unix % dottup
DNA sequence dot plot
Input sequence: embl:xl23808  (*輸入第一條序列的名稱或序號)
Second sequence: embl:xlrhodop  (*輸入第二條序列的名稱或序號)
Word size [10]:  (*預設的 word size 為 10,可自行調整)
Display as data [N]:  (*是否以 data 方式呈現,建議為 N )
Graph type [x11]: png  (*檔案輸出之格式,建議鍵入 png 或 ps)

unix % ls
dottup.1.png dottup.ps

(*以 ls 指令查看檔案,發現結果已經儲存為 .png 或 .ps 的檔案了,使用者需要利用 ftp 傳輸工具將檔案下載至自己電腦之中,才能夠顯示或修改)


Command mode EMBOSS 操作上並不困難。基本程式練習說明請按此處(pdf檔文件)。此外,它還具有方便處理多筆序列資料的優點,因此當使用者有大量序列需分析時,不妨考慮使用 Command mode EMBOSS。

若對 Command mode EMBOSS 仍有疑問者,請參考原站 EMBOSS user documentation, 或參考 Introduction to sequence analysis using EMBOSS