Penukaran Berganda/int64 Cekap dengan SSE/AVX
SSE2 menyediakan intrinsik untuk menukar vektor antara apungan ketepatan tunggal dan integer 32-bit, tetapi tidak mempunyai rakan sejawatan langsung untuk titik terapung berketepatan dua dan integer 64-bit. AVX juga tidak menawarkan penukaran ini.
Kaedah untuk mensimulasikan intrinsik
1. Untuk nilai terhad:
Jika pengehadan tertentu diterima, penukaran antara beregu dan int64 boleh dilakukan dengan hanya dua pernyataan:
berganda -> ; uint64_t:
__m128i double_to_uint64(__m128d x){ x = _mm_add_pd(x, _mm_set1_pd(0x0010000000000000)); return _mm_xor_si128( _mm_castpd_si128(x), _mm_castpd_si128(_mm_set1_pd(0x0010000000000000)) ); }
ganda -> int64_t:
__m128i double_to_int64(__m128d x){ x = _mm_add_pd(x, _mm_set1_pd(0x0018000000000000)); return _mm_sub_epi64( _mm_castpd_si128(x), _mm_castpd_si128(_mm_set1_pd(0x0018000000000000)) ); }
uint64_t -> berganda:
__m128d uint64_to_double(__m128i x){ x = _mm_or_si128(x, _mm_castpd_si128(_mm_set1_pd(0x0010000000000000))); return _mm_sub_pd(_mm_castsi128_pd(x), _mm_set1_pd(0x0010000000000000)); }
int64_t -> berganda:
__m128d int64_to_double(__m128i x){ x = _mm_add_epi64(x, _mm_castpd_si128(_mm_set1_pd(0x0018000000000000))); return _mm_sub_pd(_mm_castsi128_pd(x), _mm_set1_pd(0x0018000000000000)); }
2. Julat penuh int64 -> double:
Untuk menukar julat penuh int64 kepada double, 5 arahan diperlukan untuk uint64_t dan 6 arahan untuk int64_t:
uint64_t -> ; berganda:
__m128d uint64_to_double_full(__m128i x){ __m128i xH = _mm_srli_epi64(x, 32); xH = _mm_or_si128(xH, _mm_castpd_si128(_mm_set1_pd(19342813113834066795298816.))); // 2^84 __m128i xL = _mm_blend_epi16(x, _mm_castpd_si128(_mm_set1_pd(0x0010000000000000)), 0xcc); // 2^52 __m128d f = _mm_sub_pd(_mm_castsi128_pd(xH), _mm_set1_pd(19342813118337666422669312.)); // 2^84 + 2^52 return _mm_add_pd(f, _mm_castsi128_pd(xL)); }
int64_t -> berganda:
__m128d int64_to_double_full(__m128i x){ __m128i xH = _mm_srai_epi32(x, 16); xH = _mm_blend_epi16(xH, _mm_setzero_si128(), 0x33); xH = _mm_add_epi64(xH, _mm_castpd_si128(_mm_set1_pd(442721857769029238784.))); // 3*2^67 __m128i xL = _mm_blend_epi16(x, _mm_castpd_si128(_mm_set1_pd(0x0010000000000000)), 0x88); // 2^52 __m128d f = _mm_sub_pd(_mm_castsi128_pd(xH), _mm_set1_pd(442726361368656609280.)); // 3*2^67 + 2^52 return _mm_add_pd(f, _mm_castsi128_pd(xL)); }
AVX512
AVX512 menawarkan penukaran terus kepada/daripada integer 64-bit, kedua-duanya ditandatangani dan tidak ditandatangani ditandatangani. Penukaran ini dilakukan menggunakan intrinsik seperti _mm512_cvtpd_epi64 dan _mm256_cvtpd_epi64.
Sila ambil perhatian bahawa penyelesaian ini tidak disediakan sebagai kod lengkap. Pembaca dijangka melengkapkannya dan mengoptimumkannya mengikut keperluan untuk menyesuaikannya dengan konteks khusus mereka.
Atas ialah kandungan terperinci Bagaimanakah Saya Boleh Menukar Antara Terapung Ketepatan Berganda dan Integer 64-bit Dengan Cekap Menggunakan Arahan SSE/AVX?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!