hmmer 다운로드 및 설치
Mac OS/X, Linux, UNIX 시스템의 경우 소스 코드에서 컴파일 및 설치:
% wget ftp://selab.janelia.org/pub/software/hmmer3/3.0/hmmer-3.0.tar.gz % tar zxf hmmer-3.0.tar.gz % cd hmmer-3.0 % ./configure % make % 확인해 보세요
Windows 시스템의 경우 바이너리 압축 패키지를 직접 다운로드하여 압축을 풀어서 사용하세요.
Hmmer 포함 프로그램
phmmer: Blastp와 유사하게 단백질 서열을 사용하여 단백질 서열 라이브러리를 검색합니다.
>phmmer 튜토리얼/HBB HUMAN uniprot sprot.fajackhmmer: psiBlast와 유사하게 단백질 서열은 단백질 서열 라이브러리를 반복적으로 검색합니다.
>jackhmmer 튜토리얼/HBB HUMAN uniprot sprot.fa
hmmbuild: 여러 개의 정렬된 시퀀스를 사용하여 HMM 모델 구축
hmmsearch: HMM 모델을 사용하여 시퀀스 라이브러리를 검색합니다.
hmmscan: 시퀀스를 사용하여 HMM 라이브러리를 검색합니다.hmmalign: HMM을 단서로 사용하여 여러 정렬 시퀀스를 구성합니다.
>hmmalign globins4.hmm 튜토리얼/globins45.fahmmconvert: HMM 형식 변환
hmmemit: HMM 모델에서 패턴 시퀀스를 얻습니다.
hmmfetch: 이름이나 승인 번호로 HMM 라이브러리에서 HMM 모델을 검색합니다.
hmmpress: hmmscan 검색을 용이하게 하기 위해 HMM 데이터베이스를 포맷합니다.
hmmstat: HMM 데이터베이스의 통계 정보를 표시합니다.HMM 모델을 사용하여 시퀀스 데이터베이스 검색
hmmbuild를 사용하여 HMM 모델을 구축하고 Stockholm 형식 또는 FASTA 형식(예: tutorial/globins4.sto)의 다중 정렬 시퀀스 파일을 입력합니다. 명령은 다음과 같습니다.
>hmmbuild globins4.hmm 튜토리얼/globins4.sto
globins4.hmm 은 출력 HMM 모델입니다
단백질 서열 데이터베이스를 검색하려면 hmmsearch를 사용하세요. 단백질 서열 데이터베이스는 FASTA 형식입니다.
>hmmsearch globins4.hmm uniprot sprot.fasta >globins4.out
globins4.out은 다음과 같은 출력 결과 파일입니다.
*공식 튜토리얼의 예제 사용 예
단백질 서열을 이용하여 HMM 데이터베이스를 검색하세요
HMM 데이터베이스 구축 HMM 데이터베이스는 여러 HMM 모델이 포함된 파일입니다. Pfam, SMART 및 TIGRFams에서 다운로드하거나 다음과 같은 여러 정렬 시퀀스에서 직접 구축할 수 있습니다.
>hmmbuild globins4.hmm 튜토리얼/globins4.sto>hmmbuild fn3.hmm 튜토리얼/fn3.sto
>hmmbuild Pkinase.hmm 튜토리얼/Pkinase.sto
>cat globins4.hmm fn3.hmm Pkinase.hmm >minifam
hmmpress를 사용하여 압축 및 인덱스 생성을 포함하여 데이터베이스를 포맷합니다.
>흠프레스 미니팜
이 단계는 빠르게 완료할 수 있으며 출력 내용은 다음과 같습니다.
작업… 완료되었습니다.
HMM 3개(이름 3개, 가입 2개)를 누르고 색인화했습니다.
바이너리 파일로 압축된 모델: minifam.h3m
바이너리 모델 파일용 SSI 인덱스: minifam.h3i
프로필(MSV 부분)을 다음으로 압축: minifam.h3f
프로필(나머지)을 다음으로 압축: minifam.h3p
hmmscan을 사용하여 HMM 데이터베이스를 검색하세요. 명령어는 다음과 같습니다.
>hmmscan 미니팜 튜토리얼/7LESS_DROME
hmmer 소프트웨어를 사용하여 fasta 형식 파일을 Sto 형식으로 변환하는 방법
저도 이 문제에 직면하여 오랫동안 온라인으로 검색했지만 적절한 해결 방법을 찾을 수 없어서 직접 작성했습니다.
import glob #은 모두 표준 라이브러리의 것입니다
os 가져오기
# hmm(비교) 빌드하려는 fasta 파일을 이 프로그램과 같은 폴더에 넣은 후 이 프로그램을 실행하면 hmmbuild가 바로 실행됩니다
fs = glob.glob('*.fasta') # 각 fasta 파일을 가져옵니다. fasta 파일에 .fasta 이외의 접미사가 있는 경우 여기에서 변경하거나 '*.fa*'로 직접 변경할 수 있습니다.
fs의 f:
hmm = os.path.splitext(f)[0] + '.hmm'
스톡홀름 = os.path.splitext(f)[0] + '.sto'
with open(f, 'r') as fhandle: # 이것은 fasta 파일을 읽고 모든 fasta 파일을 목록에 저장하는 데 사용됩니다
fastas = ['>' + tmp.replace('n', 'r', 1).replace('n', '').replace('r', 'n') for tmp in tuple(filter( 없음, (fhandle.read().split('>'))))]
범위 내(len(fastas)):
fastas[i] = fastas[i].split('n')
fastas[i][0] = fastas[i][0].split()[0][1:10]
tmp = []
for j in range(len(fastas[i][1]) // 80 + 1):
tmp.append(fastas[i][1][80 * j : 80 * j + 80])
fastas[i][1] = tmp
with open(stockholm, 'w') as out: # Sto 파일이 여기에 기록되고 있습니다
out.write('# 스톡홀름 1.0nn')
for j in range(len(fastas[0][1]) - 1):
범위 내(len(fastas)):
out.write('% -12s%sn' % (fastas[i][0], fastas[i][1][j]))
out.write('n')
범위 내(len(fastas)):
out.write('% -12s%sn' % (fastas[i][0], fastas[i][1][-1]))
out.write('//')
os.system('hmmbuild --amino %s %s' % (hmm, stockholm)) # hmmbuild가 여기에서 실행 중입니다. 내부 매개변수를 직접 수정할 수 있습니다
1. 기존의 생물정보학 도구로 시작하세요. 기존 소프트웨어, 네트워크 서버, 데이터베이스 등을 사용하여 이미 만들어진 도구를 사용할 수 있다면 작업을 반복하지 마세요. .
2. 명령줄 운영 체제, DOS, Linux에 익숙하며 간단한 쉘을 작성할 수 있으며 명령줄 수준 프로그램을 설치하고 일부 일반 프로세스를 실행할 수 있습니다. 소프트웨어를 찾고 설치하는 방법을 배우는 것이 가장 중요하고 기본적인 기술입니다. 실제로 올바른 소프트웨어 패키지를 찾으면 많은 문제를 쉽게 해결할 수 있습니다.
3. 간단한 스크립팅 언어에 익숙해지세요. 저는 개인적으로 Python을 추천합니다. 작은 스크립트는 미리 만들어진 도구가 없거나 데이터 형식 변환이 필요할 때 매우 유용합니다. 일반 응용 프로그램은 자체적으로 너무 많은 코드를 작성할 필요가 없습니다. 우리가 일반적으로 직면하는 문제를 다른 전문가도 겪었을 수 있으므로 인터넷에는 수많은 툴킷이 있습니다. 더 많은 프로그래밍 언어에 관해서는 모든 것을 마스터할 수 있으며 R, Perl 등은 모두 유사합니다.
4. 간단한 알고리즘과 데이터 구조에 익숙해지므로 많은 프로그램의 내부 메커니즘을 이해할 수 있고, 그 후 장점과 단점을 알 수 있으며 이는 자신의 프로그램을 작성하는 데에도 도움이 됩니다. 에너지가 있으면 통계, 기계 학습 등을 공부하십시오. .
5. 자신의 생물학 분야 내에서 확장, 연구, 분석 및 개발하세요.
위 내용은 Windows 시스템에 HMMER 소프트웨어를 설치할 수 있습니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!