SSE/AVX による効率的な Double/int64 変換
SSE2 は、単精度浮動小数点数と 32 ビット整数の間でベクトルを変換するための組み込み関数を提供します。ただし、倍精度浮動小数点および 64 ビット整数に直接対応するものはありません。 AVX はこれらの変換も提供しません。
組み込み関数をシミュレートするメソッド
1.制限された値の場合:
特定の制限が許容される場合、double と int64 の間の変換は 2 つのステートメントだけで実行できます:
double -> ; uint64_t:
__m128i double_to_uint64(__m128d x){ x = _mm_add_pd(x, _mm_set1_pd(0x0010000000000000)); return _mm_xor_si128( _mm_castpd_si128(x), _mm_castpd_si128(_mm_set1_pd(0x0010000000000000)) ); }
double -> int64_t:
__m128i double_to_int64(__m128d x){ x = _mm_add_pd(x, _mm_set1_pd(0x0018000000000000)); return _mm_sub_epi64( _mm_castpd_si128(x), _mm_castpd_si128(_mm_set1_pd(0x0018000000000000)) ); }
uint64_t -> double:
__m128d uint64_to_double(__m128i x){ x = _mm_or_si128(x, _mm_castpd_si128(_mm_set1_pd(0x0010000000000000))); return _mm_sub_pd(_mm_castsi128_pd(x), _mm_set1_pd(0x0010000000000000)); }
int64_t -> double:
__m128d int64_to_double(__m128i x){ x = _mm_add_epi64(x, _mm_castpd_si128(_mm_set1_pd(0x0018000000000000))); return _mm_sub_pd(_mm_castsi128_pd(x), _mm_set1_pd(0x0018000000000000)); }
2.全範囲 int64 -> double:
全範囲 int64 を double に変換するには、uint64_t には 5 つの命令が必要で、int64_t には 6 つの命令が必要です。
uint64_t -> ; double:
__m128d uint64_to_double_full(__m128i x){ __m128i xH = _mm_srli_epi64(x, 32); xH = _mm_or_si128(xH, _mm_castpd_si128(_mm_set1_pd(19342813113834066795298816.))); // 2^84 __m128i xL = _mm_blend_epi16(x, _mm_castpd_si128(_mm_set1_pd(0x0010000000000000)), 0xcc); // 2^52 __m128d f = _mm_sub_pd(_mm_castsi128_pd(xH), _mm_set1_pd(19342813118337666422669312.)); // 2^84 + 2^52 return _mm_add_pd(f, _mm_castsi128_pd(xL)); }
int64_t -> double:
__m128d int64_to_double_full(__m128i x){ __m128i xH = _mm_srai_epi32(x, 16); xH = _mm_blend_epi16(xH, _mm_setzero_si128(), 0x33); xH = _mm_add_epi64(xH, _mm_castpd_si128(_mm_set1_pd(442721857769029238784.))); // 3*2^67 __m128i xL = _mm_blend_epi16(x, _mm_castpd_si128(_mm_set1_pd(0x0010000000000000)), 0x88); // 2^52 __m128d f = _mm_sub_pd(_mm_castsi128_pd(xH), _mm_set1_pd(442726361368656609280.)); // 3*2^67 + 2^52 return _mm_add_pd(f, _mm_castsi128_pd(xL)); }
AVX512
AVX512 は、符号付きおよび符号なしの両方の 64 ビット整数との直接変換を提供します。署名された。これらの変換は、_mm512_cvtpd_epi64 や _mm256_cvtpd_epi64 などの組み込みを使用して行われます。
これらのソリューションは完全なコードとして提供されていないことに注意してください。読者は、それらを完成させ、特定のコンテキストに適応させるために必要に応じて最適化することが期待されます。
以上がSSE/AVX 命令を使用して倍精度浮動小数点と 64 ビット整数の間で効率的に変換するにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。