hmmer搜索同源基因

僅供參考,另外運行過程中生成的hmm文件和out文件可能不在HMMER文件夾中,而可能存在於用戶名的文件夾中,所以很麻煩,找不到的可以在電腦全局搜索你的磁盤,hmm文件和out文件都可以用notepad++打開。

用序列搜索序列:

建立hmm模型:

1.將完全比對好的序列,我用clustalx生成clustal文件,後綴是aln

2.用在線網站把比對後的文件轉換成stockholm格式:

http://sequenceconversion.bugaco.com/converter/biology/sequences/clustal_to_fasta.php

3.打開windows終端命令界面,直接把hmmbuild.exe程序拖進窗口,會出現這樣的情況:

C:\\Users\\Ailin>E:\\hmmer3.0_windows\\hmmbuild.exe

可以直接用,例子: C:\\Users\\Ailin>E:\\hmmer3.0_windows\\hmmbuild.exe name.hmm E:\\hmmer3.0_windows\\name.stockholm(其中E:\\hmmer3.0_windows\\sample.stockholm也是直接拖過來的)

其命令其實是這樣的:hmmbuild name.hmm name.stockholm

但是我的電腦要加環境變量才能讀取數據,拖進去直接就有環境變量。

搜索同源序列:

C:\\Users\\Ailin>E:\\hmmer3.0_windows\\hmmsearch.exe E:\\hmmer3.0_windows\\name.hmm E:\\hmmer3.0_windows\\name.fa>name.out

其命令其實是:hmmsearch name.hmm name.fa>name.out

hmmsearch直接拖進去後,空格,直接拖進去hmm文件,空格,再直接拖進去需要尋找序列的庫,最後加上>name.out/name.fa即可

用Pfam的domain搜索統所需的序列:

首先知道你要尋找的domain的Pfam編號,用序列在結構域預測工具中都能搜索的到。

進入pfam關鍵詞搜索你的編號,點擊左邊Alignments,在Format an alignment中的format中選擇stockholm。下載的是txt文件,但是直接改後綴就可以了。

其餘步驟和上述一樣。


分享到:


相關文章: