성능 최적화를 위해 x86 어셈블리 출력을 읽기 쉽게 만들기
성능 최적화를 위해 Go 컴파일러의 x86 어셈블리 출력을 검사할 때 기본값은 출력을 이해하기 어려울 수 있습니다. 이 문서에서는 외부 어셈블리 파일 생성과 어셈블리 코드 내 함수 분리라는 두 가지 문제를 다룹니다.
어셈블리 파일 생성
Go 어셈블리 출력을 다음으로 리디렉션할 수 있습니다. 다음 명령을 사용하여 파일을 저장합니다.
go tool compile -S file.go > file.s
나중에 사용할 수 있도록 "file.s"라는 파일에 어셈블리 코드를 저장합니다. 분석.
함수 분리
함수를 분리하고 레이블을 추가하려면 -N 플래그를 사용하여 컴파일러 최적화를 비활성화합니다.
go tool compile -S -N file.go
또는, gccgo 컴파일러를 사용할 수 있습니다.
gccgo -S -O0 -masm=intel test.go
gccgo는 함수 경계와 레이블이 포함된 어셈블리 코드가 포함된 "test.s"라는 파일.
-O{0-3}을 사용하여 다양한 최적화 수준을 지정하면 최적화가 어셈블리 코드에 미치는 영향을 관찰하고 식별할 수 있습니다. 잠재적인 성능 개선이 필요한 영역.
위 내용은 성능 조정을 위해 Go의 x86 어셈블리 출력을 더 쉽게 읽을 수 있도록 하려면 어떻게 해야 합니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!