Hmmer-Download und Installation
Für Mac OS/X-, Linux- und UNIX-Systeme kompilieren und installieren Sie aus dem Quellcode:
% wget ftp://selab.janelia.org/pub/software/hmmer3/3.0/hmmer-3.0.tar.gz % tar zxf hmmer-3.0.tar.gz % cd hmmer-3.0 % ./configure % make % Machen Sie einen Scheck
Laden Sie für Windows-Systeme das komprimierte Binärpaket direkt herunter, dekomprimieren Sie es und verwenden Sie es.
Hmmer enthaltene Programme
phmmer: Verwendet ähnlich wie Blastp eine Proteinsequenz, um eine Proteinsequenzbibliothek zu durchsuchen
>phmmer-Tutorial/HBB HUMAN uniprot sprot.fa
jackhmmer: Ähnlich wie bei psiBlast durchsuchen Proteinsequenzen iterativ Proteinsequenzbibliotheken
>Jackhmmer-Tutorial/HBB HUMAN uniprot sprot.fa
hmmbuild: Erstellen Sie ein HMM-Modell mit mehreren ausgerichteten Sequenzen
hmmsearch: Verwenden Sie das HMM-Modell, um die Sequenzbibliothek zu durchsuchenhmmscan: HMM-Bibliothek anhand von Sequenzen durchsuchen;
hmmalign: Verwenden Sie HMM als Anhaltspunkt, um mehrere Ausrichtungssequenzen zu erstellen>hmmalign globins4.hmm Tutorial/globins45.fa
hmmconvert: HMM-Format konvertieren
hmmemit: Erhalten Sie eine Mustersequenz aus dem HMM-Modell
hmmfetch: Rufen Sie ein HMM-Modell anhand des Namens oder der Akzeptanznummer aus der HMM-Bibliothek ab
hmmpress: Formatieren Sie die HMM-Datenbank, um die hmmscan-Suche zu erleichternhmmstat: Statistische Informationen der HMM-Datenbank anzeigen;
Durchsuchen Sie Sequenzdatenbanken mithilfe von HMM-ModellenVerwenden Sie hmmbuild, um das HMM-Modell zu erstellen. Die Eingabe ist eine Multiple-Alignment-Sequenzdatei im Stockholm-Format oder FASTA-Format (z. B. Tutorial/globins4.sto). Der Befehl lautet wie folgt:
>hmmbuild globins4.hmm Tutorial/globins4.sto
globins4.hmm ist das Ausgabe-HMM-Modell
Verwenden Sie hmmsearch, um die Proteinsequenzdatenbank zu durchsuchen. Der Befehl lautet wie folgt:
>hmmsearch globins4.hmm uniprot sprot.fasta >globins4.out
globins4.out ist die Ausgabeergebnisdatei wie folgt:
*Beispiele verwenden Beispiele aus dem offiziellen Tutorial
Durchsuchen Sie die HMM-Datenbank anhand von Proteinsequenzen
Erstellen Sie eine HMM-Datenbank. Die HMM-Datenbank ist eine Datei, die mehrere HMM-Modelle enthält. Sie kann von Pfam, SMART und TIGRFams heruntergeladen oder selbst aus mehreren Ausrichtungssequenzen erstellt werden, wie zum Beispiel:
>hmmbuild globins4.hmm Tutorial/globins4.sto
>hmmbuild fn3.hmm Tutorial/fn3.sto
>hmmbuild Pkinase.hmm Tutorial/Pkinase.sto
>cat globins4.hmm fn3.hmm Pkinase.hmm >minifam
Verwenden Sie hmmpress, um die Datenbank zu formatieren, einschließlich Komprimierung und Indexerstellung. Der Befehl lautet wie folgt:
>hmmpress minifam
Dieser Schritt kann schnell abgeschlossen werden und der Ausgabeinhalt lautet wie folgt:
Arbeiten… fertig.
Gepresste und indexierte 3 HMMs (3 Namen und 2 Akzessionen).
Modelle in Binärdatei gepresst: minifam.h3m
SSI-Index für binäre Modelldatei: minifam.h3i
Profile (MSV-Teil) eingepresst in: minifam.h3f
Profile (Rest) eingedrückt in: minifam.h3p
Verwenden Sie hmmscan, um die HMM-Datenbank zu durchsuchen. Der Befehl lautet wie folgt:
>hmmscan minifam-Tutorial/7LESS_DROME
So konvertieren Sie Dateien im Fasta-Format mit der Hmmer-Software in das Sto-Format.
Ich bin auch lange auf dieses Problem gestoßen und konnte keine passende Lösung finden, also habe ich selbst eine geschrieben
import glob # sind alle Dinge aus der Standardbibliothek
Betriebssystem importieren
os.chdir(os.path.dirname(__file__))
fs = glob.glob('*.fasta') # Jede Fasta-Datei abrufen Wenn Ihre Fasta-Datei ein anderes Suffix als .fasta hat, können Sie es hier ändern oder direkt in „*.fa*“ ändern
für f in fs:hmm = os.path.splitext(f)[0] + '.hmm'
stockholm = os.path.splitext(f)[0] + '.sto'
mit open(f, 'r') als fhandle: # Dies wird verwendet, um Fasta-Dateien zu lesen und alle Fasta-Dateien in der Liste zu speichern
fastas = ['>' + tmp.replace('n', 'r', 1).replace('n', '').replace('r', 'n') für tmp in tuple(filter( Keine, (fhandle.read().split('>'))))]
für mich in Reichweite(len(fastas)):
fastas[i] = fastas[i].split('n')
fastas[i][0] = fastas[i][0].split()[0][1:10]
tmp = []
für j in range(len(fastas[i][1]) // 80 + 1):
tmp.append(fastas[i][1][80 * j : 80 * j + 80])
fastas[i][1] = tmp
with open(stockholm, 'w') as out: # Die Sto-Datei wird hier geschrieben
out.write('# STOCKHOLM 1.0nn')
für j im Bereich(len(fastas[0][1]) - 1):
für mich in Reichweite(len(fastas)):
out.write('% -12s%sn' % (fastas[i][0], fastas[i][1][j]))
out.write('n')
für mich in Reichweite(len(fastas)):
out.write('% -12s%sn' % (fastas[i][0], fastas[i][1][-1]))
out.write('//')
os.system('hmmbuild --amino %s %s' % (hmm, stockholm)) # hmmbuild läuft hier, Sie können die Parameter darin selbst ändern
1. Beginnen Sie mit der Verwendung vorhandener Bioinformatik-Tools, Netzwerkservern usw. Wiederholen Sie Ihre Arbeit nicht, wenn Sie bereits fertige Tools verwenden können .
2. Sie sind mit Befehlszeilen-Betriebssystemen, DOS und Linux vertraut und können einfache Shells schreiben und dann in der Lage sein, Programme auf Befehlszeilenebene zu installieren und einige reguläre Prozesse auszuführen. Zu lernen, wie man Software findet und installiert, ist die wichtigste und grundlegendste Fähigkeit. Tatsächlich lassen sich viele Probleme leicht lösen, wenn Sie das richtige Softwarepaket finden.
3. Seien Sie mit einer einfachen Skriptsprache vertraut. Ich persönlich empfehle Python. Weitere Informationen finden Sie in meinem Beitrag. Kleine Skripte sind sehr nützlich, wenn keine fertigen Tools vorhanden sind oder eine Datenformatkonvertierung erforderlich ist. Allgemeine Anwendungen müssen nicht zu viel Code selbst schreiben. Wir müssen davon ausgehen, dass andere Experten möglicherweise auf die Probleme gestoßen sind, auf die wir normalerweise stoßen. Daher gibt es im Internet eine große Anzahl von Toolkits. Was weitere Programmiersprachen betrifft, kann man alles beherrschen, R, Perl usw. sind alle ähnlich.
4. Machen Sie sich mit einfachen Algorithmen und Datenstrukturen vertraut, damit Sie die internen Mechanismen vieler Programme verstehen und deren Vor- und Nachteile kennen, was auch beim Schreiben Ihrer eigenen Programme hilfreich ist. Wenn Sie die Energie haben, dann studieren Sie Statistik, maschinelles Lernen usw. .
5. Erweitern, erforschen, analysieren und entwickeln Sie Ihr eigenes biologisches Feld.
Das obige ist der detaillierte Inhalt vonKann ich die HMMER-Software auf Windows-Systemen installieren?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!