Go의 어셈블러에서 전역 데이터를 NEON 레지스터에 보다 효율적으로 로드하는 방법은 무엇입니까?
php小编百草为您带来了关于在Go的汇编器中如何更高效地将全局数据加载到NEON寄存器的解决方案。Go语言在底层使用汇编器来优化性能,而NEON寄存器是ARM架构中的一种特殊寄存器,用于加速多媒体和信号处理操作。本文将介绍如何使用适当的指令和技巧,以提高数据加载到NEON寄存器的效率,从而优化Go程序的性能。让我们一起来看看吧!
问题内容
arm64 asm代码中有p256one全局数据作为示例:
DATA p256one<>+0x00(SB)/8, $0x0000000000000001 DATA p256one<>+0x08(SB)/8, $0xffffffff00000000 DATA p256one<>+0x10(SB)/8, $0xffffffffffffffff DATA p256one<>+0x18(SB)/8, $0x00000000fffffffe GLOBL p256one<>(SB), 8, $32
我需要将 p256one<>(SB) 加载到 V0 和 V1 寄存器中。目前我使用以下方法:
LDP p256one<>+0x00(SB), (R0, R1) LDP p256one<>+0x10(SB), (R2, R3) VMOV R0, V0.D[0] VMOV R1, V0.D[1] VMOV R2, V1.D[0] VMOV R3, V1.D[1]
这里总共使用了六个指令。我们知道我们可以加载内存数据,如下所示:
VLD1 (R0), [V0.B16, V1.B16]
但是我们似乎无法用同样的方法加载全局数据。
那么,在Go的汇编代码中是否有更高效的方式将全局数据加载到NEON寄存器中呢?
解决方法
尝试将地址加载到寄存器中,然后从该地址加载:
MOVD $p256one<>(SB), R0 VLD1 (R0), [V0.B16, V1.B16]
위 내용은 Go의 어셈블러에서 전역 데이터를 NEON 레지스터에 보다 효율적으로 로드하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

핫 AI 도구

Undresser.AI Undress
사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover
사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool
무료로 이미지를 벗다

Clothoff.io
AI 옷 제거제

AI Hentai Generator
AI Hentai를 무료로 생성하십시오.

인기 기사

뜨거운 도구

메모장++7.3.1
사용하기 쉬운 무료 코드 편집기

SublimeText3 중국어 버전
중국어 버전, 사용하기 매우 쉽습니다.

스튜디오 13.0.1 보내기
강력한 PHP 통합 개발 환경

드림위버 CS6
시각적 웹 개발 도구

SublimeText3 Mac 버전
신 수준의 코드 편집 소프트웨어(SublimeText3)

뜨거운 주제











Go Crawler Colly의 대기열 스레딩 문제는 Colly Crawler 라이브러리를 GO 언어로 사용하는 문제를 탐구합니다. � ...

GO의 어떤 라이브러리가 대기업이나 잘 알려진 오픈 소스 프로젝트에서 개발 했습니까? GO에 프로그래밍 할 때 개발자는 종종 몇 가지 일반적인 요구를 만납니다.

Go Language의 부동 소수점 번호 작동에 사용되는 라이브러리는 정확도를 보장하는 방법을 소개합니다.

Go Language의 문자열 인쇄의 차이 : println 및 String () 함수 사용 효과의 차이가 진행 중입니다 ...

GO 언어 개발을 위해 Goland를 사용할 때 Goland의 사용자 정의 구조 태그 문제와 관련하여 종종 구성 문제가 발생합니다. 그들 중 하나는 ...

Go Pointer Syntax 및 Viper Library 사용의 문제 해결 GO 언어로 프로그래밍 할 때 특히 포인터의 구문 및 사용법을 이해하는 것이 중요합니다.

GO의지도 반복이 왜 모든 값이 마지막 요소가되게합니까? Go Language에서 인터뷰 질문에 직면했을 때, 당신은 종종지도를 만납니다 ...

Golang을 사용하여 Linux를 구현 ...
