Bagaimanakah Cara Mengemas Secara Cekap Dikiri Berdasarkan Topeng Menggunakan AVX2?
Ikhtisar Masalah:
Memandangkan tatasusunan input dan tatasusunan keluaran, matlamatnya adalah untuk menulis hanya unsur-unsur yang melepasi syarat tertentu ke dalam output tatasusunan. Operasi ini penting dalam pelbagai aplikasi, termasuk penapisan data dan manipulasi imej.
Pendekatan SSE:
Dalam SSE, proses ini secara tradisinya dicapai menggunakan pendekatan data kawalan shuffle , seperti yang diterangkan dalam coretan kod yang disediakan. Walau bagaimanapun, kaedah ini menjadi rumit untuk AVX, yang mempunyai vektor 8 lebar, memerlukan jadual carian yang besar.
Penyelesaian AVX2:
Untuk menangani isu ini, AVX2 menawarkan dua pilihan:
Menggunakan BMI2 Arahan:
Pendekatan Lut:
Kaedah Terbaik:
Pendekatan optimum bergantung pada keperluan khusus permohonan itu. Untuk set data yang besar, pendekatan LUT mungkin lebih disukai kerana overhed yang lebih rendah dan kecekapan cache yang lebih baik. Walau bagaimanapun, untuk set data atau aplikasi yang lebih kecil yang mengutamakan kelajuan, penyelesaian berasaskan BMI2 boleh memberikan prestasi yang lebih baik.
Atas ialah kandungan terperinci Bagaimanakah Arahan AVX2 Boleh Mengoptimumkan Pembungkusan Berasaskan Kiri dengan Topeng?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!