Memuatkan 8 Aksara daripada Memori ke dalam Pembolehubah __m256 sebagai Terapung Ketepatan Tunggal Berbungkus
Dalam usaha mengoptimumkan algoritma untuk Gaussian blur, anda cuba menggantikan penggunaan penimbal apungan dengan pembolehubah intrinsik __m256. Soalan ini bertujuan untuk menentukan arahan optimum untuk tugasan ini.
Arahan untuk Seni Bina AVX2:
; rsi = new_image VPMOVZXBD ymm0, [rsi] ; or SX to sign-extend (Byte to DWord) VCVTDQ2PS ymm0, ymm0 ; convert to packed foat
Strategi Tambahan:
Arahan untuk Seni Bina AVX1:
Lakukan langkah berikut:
VPMOVZXBD xmm0, [rsi] VPMOVZXBD xmm1, [rsi+4] VINSERTF128 ymm0, ymm0, xmm1, 1 ; put the 2nd load of data into the high128 of ymm0 VCVTDQ2PS ymm0, ymm0 ; convert to packed float
Pertimbangan Intrinsik:
Atas ialah kandungan terperinci Bagaimana untuk Memuatkan 8 Aksara ke dalam Pembolehubah __m256 sebagai Terapung Ketepatan Tunggal Berbungkus?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!