僅供參考,另外運行過程中生成的hmm文件和out文件可能不在HMMER文件夾中,而可能存在於用戶名的文件夾中,所以很麻煩,找不到的可以在電腦全局搜索你的磁盤,hmm文件和out文件都可以用notepad++打開。
用序列搜索序列:
建立hmm模型:
1.將完全比對好的序列,我用clustalx生成clustal文件,後綴是aln
2.用在線網站把比對後的文件轉換成stockholm格式:
http://sequenceconversion.bugaco.com/converter/biology/sequences/clustal_to_fasta.php
3.打開windows終端命令界面,直接把hmmbuild.exe程序拖進窗口,會出現這樣的情況:
C:\\Users\\Ailin>E:\\hmmer3.0_windows\\hmmbuild.exe
可以直接用,例子: C:\\Users\\Ailin>E:\\hmmer3.0_windows\\hmmbuild.exe name.hmm E:\\hmmer3.0_windows\\name.stockholm(其中E:\\hmmer3.0_windows\\sample.stockholm也是直接拖過來的)
其命令其實是這樣的:hmmbuild name.hmm name.stockholm
但是我的電腦要加環境變量才能讀取數據,拖進去直接就有環境變量。
搜索同源序列:
C:\\Users\\Ailin>E:\\hmmer3.0_windows\\hmmsearch.exe E:\\hmmer3.0_windows\\name.hmm E:\\hmmer3.0_windows\\name.fa>name.out
其命令其實是:hmmsearch name.hmm name.fa>name.out
hmmsearch直接拖進去後,空格,直接拖進去hmm文件,空格,再直接拖進去需要尋找序列的庫,最後加上>name.out/name.fa即可
用Pfam的domain搜索統所需的序列:
首先知道你要尋找的domain的Pfam編號,用序列在結構域預測工具中都能搜索的到。
進入pfam關鍵詞搜索你的編號,點擊左邊Alignments,在Format an alignment中的format中選擇stockholm。下載的是txt文件,但是直接改後綴就可以了。
其餘步驟和上述一樣。
閱讀更多 ll科學大雜燴 的文章