목차
问题内容
解决方法
백엔드 개발 Golang Go의 어셈블러에서 전역 데이터를 NEON 레지스터에 보다 효율적으로 로드하는 방법은 무엇입니까?

Go의 어셈블러에서 전역 데이터를 NEON 레지스터에 보다 효율적으로 로드하는 방법은 무엇입니까?

Feb 12, 2024 pm 08:39 PM
언어로 가다

Go의 어셈블러에서 전역 데이터를 NEON 레지스터에 보다 효율적으로 로드하는 방법은 무엇입니까?

php小编百草为您带来了关于在Go的汇编器中如何更高效地将全局数据加载到NEON寄存器的解决方案。Go语言在底层使用汇编器来优化性能,而NEON寄存器是ARM架构中的一种特殊寄存器,用于加速多媒体和信号处理操作。本文将介绍如何使用适当的指令和技巧,以提高数据加载到NEON寄存器的效率,从而优化Go程序的性能。让我们一起来看看吧!

问题内容

arm64 asm代码中有p256one全局数据作为示例:

DATA p256one<>+0x00(SB)/8, $0x0000000000000001
DATA p256one<>+0x08(SB)/8, $0xffffffff00000000
DATA p256one<>+0x10(SB)/8, $0xffffffffffffffff
DATA p256one<>+0x18(SB)/8, $0x00000000fffffffe

GLOBL p256one<>(SB), 8, $32
로그인 후 복사

我需要将 p256one<>(SB) 加载到 V0 和 V1 寄存器中。目前我使用以下方法:

LDP p256one<>+0x00(SB), (R0, R1)
    LDP p256one<>+0x10(SB), (R2, R3)
    VMOV R0, V0.D[0]
    VMOV R1, V0.D[1]
    VMOV R2, V1.D[0]
    VMOV R3, V1.D[1]
로그인 후 복사

这里总共使用了六个指令。我们知道我们可以加载内存数据,如下所示:

VLD1 (R0), [V0.B16, V1.B16]
로그인 후 복사

但是我们似乎无法用同样的方法加载全局数据。

那么,在Go的汇编代码中是否有更高效的方式将全局数据加载到NEON寄存器中呢?

解决方法

尝试将地址加载到寄存器中,然后从该地址加载:

MOVD $p256one<>(SB), R0
    VLD1 (R0), [V0.B16, V1.B16]
로그인 후 복사

위 내용은 Go의 어셈블러에서 전역 데이터를 NEON 레지스터에 보다 효율적으로 로드하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.

핫 AI 도구

Undresser.AI Undress

Undresser.AI Undress

사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover

AI Clothes Remover

사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool

Undress AI Tool

무료로 이미지를 벗다

Clothoff.io

Clothoff.io

AI 옷 제거제

AI Hentai Generator

AI Hentai Generator

AI Hentai를 무료로 생성하십시오.

뜨거운 도구

메모장++7.3.1

메모장++7.3.1

사용하기 쉬운 무료 코드 편집기

SublimeText3 중국어 버전

SublimeText3 중국어 버전

중국어 버전, 사용하기 매우 쉽습니다.

스튜디오 13.0.1 보내기

스튜디오 13.0.1 보내기

강력한 PHP 통합 개발 환경

드림위버 CS6

드림위버 CS6

시각적 웹 개발 도구

SublimeText3 Mac 버전

SublimeText3 Mac 버전

신 수준의 코드 편집 소프트웨어(SublimeText3)

Go 's Crawler Colly의 큐 스레드의 문제는 무엇입니까? Go 's Crawler Colly의 큐 스레드의 문제는 무엇입니까? Apr 02, 2025 pm 02:09 PM

Go Crawler Colly의 대기열 스레딩 문제는 Colly Crawler 라이브러리를 GO 언어로 사용하는 문제를 탐구합니다. � ...

GO의 어떤 라이브러리가 대기업에서 개발하거나 잘 알려진 오픈 소스 프로젝트에서 제공합니까? GO의 어떤 라이브러리가 대기업에서 개발하거나 잘 알려진 오픈 소스 프로젝트에서 제공합니까? Apr 02, 2025 pm 04:12 PM

GO의 어떤 라이브러리가 대기업이나 잘 알려진 오픈 소스 프로젝트에서 개발 했습니까? GO에 프로그래밍 할 때 개발자는 종종 몇 가지 일반적인 요구를 만납니다.

GO에서 플로팅 포인트 번호 작업에 어떤 라이브러리가 사용됩니까? GO에서 플로팅 포인트 번호 작업에 어떤 라이브러리가 사용됩니까? Apr 02, 2025 pm 02:06 PM

Go Language의 부동 소수점 번호 작동에 사용되는 라이브러리는 정확도를 보장하는 방법을 소개합니다.

이동 중에 왜 println 및 string () 함수로 문자열이 다른 효과를 갖는 이유는 무엇입니까? 이동 중에 왜 println 및 string () 함수로 문자열이 다른 효과를 갖는 이유는 무엇입니까? Apr 02, 2025 pm 02:03 PM

Go Language의 문자열 인쇄의 차이 : println 및 String () 함수 사용 효과의 차이가 진행 중입니다 ...

Goland의 사용자 정의 구조 레이블이 적용되지 않는 문제를 해결하는 방법은 무엇입니까? Goland의 사용자 정의 구조 레이블이 적용되지 않는 문제를 해결하는 방법은 무엇입니까? Apr 02, 2025 pm 12:51 PM

GO 언어 개발을 위해 Goland를 사용할 때 Goland의 사용자 정의 구조 태그 문제와 관련하여 종종 구성 문제가 발생합니다. 그들 중 하나는 ...

Go 및 Viper 라이브러리를 사용할 때 포인터를 전달 해야하는 이유는 무엇입니까? Go 및 Viper 라이브러리를 사용할 때 포인터를 전달 해야하는 이유는 무엇입니까? Apr 02, 2025 pm 04:00 PM

Go Pointer Syntax 및 Viper Library 사용의 문제 해결 GO 언어로 프로그래밍 할 때 특히 포인터의 구문 및 사용법을 이해하는 것이 중요합니다.

Go Language to Traverse 슬라이스 및 매장 맵에 범위를 사용할 때 모든 값이 마지막 요소가되는 이유는 무엇입니까? Go Language to Traverse 슬라이스 및 매장 맵에 범위를 사용할 때 모든 값이 마지막 요소가되는 이유는 무엇입니까? Apr 02, 2025 pm 04:09 PM

GO의지도 반복이 왜 모든 값이 마지막 요소가되게합니까? Go Language에서 인터뷰 질문에 직면했을 때, 당신은 종종지도를 만납니다 ...

Golang에서 Linux iptables 링크 된 목록에서 작업을 구현하는 방법은 무엇입니까? Golang에서 Linux iptables 링크 된 목록에서 작업을 구현하는 방법은 무엇입니까? Apr 02, 2025 am 10:18 AM

Golang을 사용하여 Linux를 구현 ...

See all articles