ダウンロードとインストール
Mac OS/X、Linux、UNIX システムの場合は、ソース コードからコンパイルしてインストールします:
% wget ftp://selab.janelia.org/pub/software/hmmer3/3.0/hmmer-3.0.tar.gz % tar zxf hmmer-3.0.tar.gz % cd hmmer-3.0 % ./configure % make % make check
Windows システムの場合は、バイナリ圧縮パッケージを直接ダウンロードし、解凍して使用します。
hmmer に含まれるプログラム
phmmer: Blastp と同様に、タンパク質配列を使用してタンパク質配列ライブラリを検索します;
>phmmer チュートリアル/HBB HUMAN uniprot sprot.fa
jackhmmer: psiBlast と同様に、タンパク質配列はタンパク質配列ライブラリを繰り返し検索します。
>jackhmmer チュートリアル/HBB HUMAN uniprot sprot.fahmmbuild: 複数のアライメント シーケンスを使用して HMM モデルを構築します;
hmmsearch: HMM モデルを使用して配列ライブラリを検索します;
hmmscan: シーケンスを使用して HMM ライブラリを検索します;
hmmalign: 複数のアライメント シーケンスを構築するための手がかりとして HMM を使用します;
>hmmalign globins4.hmm チュートリアル/globins45.fa
hmmconvert: HMM 形式を変換します
hmmemit: HMM モデルからパターン シーケンスを取得します;
hmmfetch: 名前または受付番号によって HMM ライブラリから HMM モデルを取得します;
hmmpress: HMM データベースをフォーマットして、hmscan の検索と使用を容易にします;
hmmstat: HMM データベースの統計情報を表示します;
HMMモデルを用いた配列データベースの検索
hmmbuild を使用して HMM モデルを構築し、ストックホルム形式または FASTA 形式のマルチプル アライメント シーケンス ファイル (tutorial/globins4.sto など) を入力します。コマンドは次のとおりです。
>hmmbuild globins4.hmm チュートリアル/globins4.sto
globins4.hmm は出力 HMM モデルです
hmmsearch を使用してタンパク質配列データベースを検索します。タンパク質配列データベースは FASTA 形式です。コマンドは次のとおりです:
>hmmsearch globins4.hmm uniprot sprot.fasta >globins4.out
globins4.out は、次のような出力結果ファイルです。
#この例では、公式チュートリアルの例を使用しています
タンパク質配列を使用して HMM データベースを検索します
HMM データベースを構築します。HMM データベースは、複数の HMM モデルを含むファイルです。Pfam、SMART、TIGRFams からダウンロードすることも、次のような複数のアライメント シーケンスから自分で構築することもできます。
>hmmbuild globins4.hmm チュートリアル/globins4.sto>hmmbuild fn3.hmm チュートリアル/fn3.sto
>hmmbuild Pkinase.hmm チュートリアル/Pkinase.sto
>cat globins4.hmm fn3.hmm Pkinase.hmm >minifam
hmmpress を使用して、圧縮やインデックスの作成を含むデータベースをフォーマットします。コマンドは次のとおりです:
>hmmpress ミニファム
このステップはすぐに完了でき、出力内容は次のとおりです。
作業中…完了しました。
3 つの HMM (3 つの名前と 2 つのアクセッション) が押されてインデックス付けされました。
モデルはバイナリ ファイルに圧縮されました: minifam.h3m
バイナリ モデル ファイルの SSI インデックス: minifam.h3i
プロファイル (MSV 部分) が圧縮されました: minifam.h3f
プロファイル (残り) が圧縮されました: minifam.h3p
hmmscan を使用して HMM データベースを検索します。コマンドは次のとおりです:
>hmmscan ミニファム チュートリアル/7LESS_DROME
hmmer ソフトウェアはどのようにして fasta 形式のファイルを sto 形式に変換しますか?
私もこの問題に遭遇しました。長時間オンラインで検索しましたが、適切な解決策が見つからなかったので、自分で解決策を書きました。コードは次のとおりです。
OSをインポート
# hmm をビルドしたい fasta ファイル (比較済み) をこのプログラムと同じフォルダーに置き、このプログラムを実行して hmmbuild を実行します。
os.chdir(os.path.dirname(__file__))
fs = glob.glob('*.fasta') # 各 fasta ファイルを取得します。fasta ファイルに .fasta 以外のサフィックスが付いている場合は、ここで変更するか、直接 '*.fa*' に変更できます。
fs の f の場合:
hmm = os.path.splitext(f)[0] '.hmm'
ストックホルム = os.path.splitext(f)[0] '.sto'
with open(f, 'r') as fhandle: # これは、fasta ファイルを読み取り、すべての fasta ファイルをリストに保存するために使用されます
fastas = ['>' tmp.replace('\n', '\r', 1).replace('\n', '').replace('\r', '\n') forタプルの tmp(filter(None, (fhandle.read().split('>'))))]
for i in range(len(fastas)):
fastas[i] = fastas[i].split('\n')
fastas[i][0] = fastas[i][0].split()[0][1:10]
tmp = []
for j in range(len(fastas[i][1]) // 80 1):
tmp.append(fastas[i][1][80 * j : 80 * j 80])
fastas[i][1] = tmp
with open(stockholm, 'w') as out: # sto ファイルはここに書かれています
out.write('# ストックホルム 1.0\n\n')
for j in range(len(fastas[0][1]) - 1):
for i in range(len(fastas)):
out.write('% -12s%s\n' % (fastas[i][0], fastas[i][1][j]))
out.write('\n')
for i in range(len(fastas)):
out.write('% -12s%s\n' % (fastas[i][0], fastas[i][1][-1]))
out.write('//')
os.system('hmmbuild --amino %s %s' % (hmm, Stockholm)) # hmmbuild はここで実行されており、
内のパラメータを変更できます1. 既存のバイオインフォマティクス ツールから始めます。生物学研究に役立つ既存のソフトウェア、ネットワーク サーバー、データベースなどの使用方法に慣れてください。作業を繰り返さないでください。既製のツールを使用できる場合は、独自のツールを開発しないでください。作ったもの。
2. DOS や Linux などのコマンド ライン オペレーティング システムに慣れていると、単純なシェルを作成でき、コマンド ライン レベルのプログラムをインストールして通常のプロセスを実行できます。ソフトウェアを見つけてインストールする方法を学ぶことは、最も重要かつ基本的なスキルです。実際、適切なソフトウェア パッケージを見つければ、多くの問題を簡単に解決できます。
3. 簡単なスクリプト言語に慣れてください。個人的には Python の使用をお勧めします。具体的な理由については、私の投稿を参照してください。小さなスクリプトは、既製のツールがない場合、またはデータ形式の変換が必要な場合に非常に役立ちます。一般的なアプリケーションは、それ自体で多くのコードを記述する必要はありませんが、私たちが通常遭遇する問題は他の専門家も遭遇している可能性があると考えなければならないため、インターネット上には多数のツールキットが存在します。その他のプログラミング言語に関しては、R や perl などはどれも似たようなもので、すべてをマスターできます。
4. 簡単なアルゴリズムやデータ構造の知識を身につけておくと、多くのプログラムの内部機構を理解し、その長所と短所を知ることができ、独自のプログラムを書く際にも役立ちます。体力があれば統計学や機械学習などを勉強しましょう。 。
5. 独自の生物学分野の範囲を拡大、研究、分析、開発します。
以上がHMMER ソフトウェアを Windows システムにインストールできますか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。