如何在Go的彙編器中更有效率地將全域資料載入到NEON暫存器?
Feb 12, 2024 pm 08:39 PM
go語言
php小编百草为您带来了关于在Go的汇编器中如何更高效地将全局数据加载到NEON寄存器的解决方案。Go语言在底层使用汇编器来优化性能,而NEON寄存器是ARM架构中的一种特殊寄存器,用于加速多媒体和信号处理操作。本文将介绍如何使用适当的指令和技巧,以提高数据加载到NEON寄存器的效率,从而优化Go程序的性能。让我们一起来看看吧!
问题内容
arm64 asm代码中有p256one全局数据作为示例:
DATA p256one<>+0x00(SB)/8, $0x0000000000000001 DATA p256one<>+0x08(SB)/8, $0xffffffff00000000 DATA p256one<>+0x10(SB)/8, $0xffffffffffffffff DATA p256one<>+0x18(SB)/8, $0x00000000fffffffe GLOBL p256one<>(SB), 8, $32
登入後複製
我需要将 p256one<>(SB) 加载到 V0 和 V1 寄存器中。目前我使用以下方法:
LDP p256one<>+0x00(SB), (R0, R1) LDP p256one<>+0x10(SB), (R2, R3) VMOV R0, V0.D[0] VMOV R1, V0.D[1] VMOV R2, V1.D[0] VMOV R3, V1.D[1]
登入後複製
这里总共使用了六个指令。我们知道我们可以加载内存数据,如下所示:
VLD1 (R0), [V0.B16, V1.B16]
登入後複製
但是我们似乎无法用同样的方法加载全局数据。
那么,在Go的汇编代码中是否有更高效的方式将全局数据加载到NEON寄存器中呢?
解决方法
尝试将地址加载到寄存器中,然后从该地址加载:
MOVD $p256one<>(SB), R0 VLD1 (R0), [V0.B16, V1.B16]
登入後複製
以上是如何在Go的彙編器中更有效率地將全域資料載入到NEON暫存器?的詳細內容。更多資訊請關注PHP中文網其他相關文章!
本網站聲明
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn

熱門文章
擊敗分裂小說需要多長時間?
3 週前
By DDD
倉庫:如何復興隊友
3 週前
By 尊渡假赌尊渡假赌尊渡假赌
Hello Kitty Island冒險:如何獲得巨型種子
3 週前
By 尊渡假赌尊渡假赌尊渡假赌
公眾號網頁更新緩存難題:如何避免版本更新後舊緩存影響用戶體驗?
3 週前
By 王林
R.E.P.O.能量晶體解釋及其做什麼(黃色晶體)
1 週前
By 尊渡假赌尊渡假赌尊渡假赌

熱門文章
擊敗分裂小說需要多長時間?
3 週前
By DDD
倉庫:如何復興隊友
3 週前
By 尊渡假赌尊渡假赌尊渡假赌
Hello Kitty Island冒險:如何獲得巨型種子
3 週前
By 尊渡假赌尊渡假赌尊渡假赌
公眾號網頁更新緩存難題:如何避免版本更新後舊緩存影響用戶體驗?
3 週前
By 王林
R.E.P.O.能量晶體解釋及其做什麼(黃色晶體)
1 週前
By 尊渡假赌尊渡假赌尊渡假赌

熱門文章標籤

記事本++7.3.1
好用且免費的程式碼編輯器

SublimeText3漢化版
中文版,非常好用

禪工作室 13.0.1
強大的PHP整合開發環境

Dreamweaver CS6
視覺化網頁開發工具

SublimeText3 Mac版
神級程式碼編輯軟體(SublimeText3)