Jadual Kandungan
Pelaksanaan log2(__m256d) yang Cekap dalam AVX2
Rumah pembangunan bahagian belakang C++ Bagaimanakah Kami Boleh Melaksanakan log2(__m256d) dengan Cekap dalam AVX2 untuk Kedua-dua Pemproses Intel dan AMD?

Bagaimanakah Kami Boleh Melaksanakan log2(__m256d) dengan Cekap dalam AVX2 untuk Kedua-dua Pemproses Intel dan AMD?

Nov 27, 2024 pm 03:49 PM

How Can We Efficiently Implement log2(__m256d) in AVX2 for Both Intel and AMD Processors?

Pelaksanaan log2(__m256d) yang Cekap dalam AVX2

SVML __m256d _mm256_log2_pd (__m256d a) terhad kepada pengkompil Intel pada AMD dan dilaporkan perlahan. Pelaksanaan alternatif wujud, tetapi ia sering menumpukan pada SSE dan bukannya AVX2. Perbincangan ini bertujuan untuk menyediakan pelaksanaan log2() yang cekap untuk vektor empat nombor berganda yang serasi dengan pelbagai penyusun dan berfungsi dengan baik pada kedua-dua pemproses AMD dan Intel.

Strategi Tradisional

Pendekatan biasa memanfaatkan formula log2(a*b) = log2(a) log2(b), yang memudahkan kepada eksponen log2(mantissa) untuk nombor berganda. Mantissa mempunyai julat terhad 1.0 hingga 2.0, menjadikannya sesuai untuk anggaran polinomial untuk mendapatkan log2(mantissa).

Ketepatan dan Ketepatan

Ketepatan dan yang diingini julat input mempengaruhi pelaksanaan. VCL Agner Fog bertujuan untuk ketepatan tinggi menggunakan teknik mengelakkan ralat. Walau bagaimanapun, untuk log apungan anggaran yang lebih pantas(), pertimbangkan pelaksanaan polinomial JRF (didapati di sini: http://jrfonseca.blogspot.ca/2008/09/fast-sse2-pow-tables-or-polynomials.html).

Algoritma VCL

Fungsi log dan berganda VCL mengikuti a pendekatan dua bahagian:

  1. Eksponen eksponen dan mantissa: Eksponen ditukar kembali kepada apungan, dan mantissa dilaraskan dengan semakan untuk nilai kurang daripada SQRT2*0.5. Ini diikuti dengan penolakan 1.0 daripada mantissa.
  2. Penghampiran polinomial: Penghampiran polinomial digunakan pada mantissa terlaras untuk mengira log(x) sekitar x=1.0. Untuk ketepatan berganda, VCL menggunakan nisbah dua polinomial tertib ke-5.

Keputusan akhir diperoleh dengan menambahkan eksponen pada penghampiran polinomial. VCL termasuk langkah tambahan untuk meminimumkan ralat pembundaran.

Penghampiran Polinomial Alternatif

Untuk meningkatkan ketepatan, anda boleh menggunakan VCL secara terus. Walau bagaimanapun, untuk pelaksanaan log2() anggaran yang lebih pantas untuk apungan, pertimbangkan untuk mengalihkan fungsi SSE2 JRF ke AVX2 dengan FMA.

Mengelakkan Ralat Pembundaran

VCL menggunakan pelbagai teknik untuk mengurangkan ralat pembundaran. Ini termasuk:

  • Memisahkan ln2 kepada pemalar yang lebih kecil (ln2_lo dan ln2_hi)
  • Menambah garis res = nmul_add(x2, 0.5, x); kepada penilaian polinomial

Melucutkan Langkah yang Tidak Perlu

Jika nilai anda diketahui terhingga dan positif, anda boleh meningkatkan prestasi dengan ketara dengan mengulas semakan untuk aliran bawah, limpahan atau denormal.

Selanjutnya Membaca

  • [Penghampiran polinomial dengan ralat minimaks](http://gallium.inria.fr/blog/fast-vectorizable-math-approx/)
  • [Logaritma anggaran cepat menggunakan bit manipulasi](http://www.machinedlearnings.com/2011/06/fast-approximate-logarithm-exponential.html)

Atas ialah kandungan terperinci Bagaimanakah Kami Boleh Melaksanakan log2(__m256d) dengan Cekap dalam AVX2 untuk Kedua-dua Pemproses Intel dan AMD?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan Laman Web ini
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn

Alat AI Hot

Undresser.AI Undress

Undresser.AI Undress

Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover

AI Clothes Remover

Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool

Undress AI Tool

Gambar buka pakaian secara percuma

Clothoff.io

Clothoff.io

Penyingkiran pakaian AI

Video Face Swap

Video Face Swap

Tukar muka dalam mana-mana video dengan mudah menggunakan alat tukar muka AI percuma kami!

Artikel Panas

<🎜>: Bubble Gum Simulator Infinity - Cara Mendapatkan dan Menggunakan Kekunci Diraja
3 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌
Nordhold: Sistem Fusion, dijelaskan
4 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌
Mandragora: Whispers of the Witch Tree - Cara Membuka Kunci Cangkuk Bergelut
3 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌

Alat panas

Notepad++7.3.1

Notepad++7.3.1

Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina

SublimeText3 versi Cina

Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1

Hantar Studio 13.0.1

Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6

Dreamweaver CS6

Alat pembangunan web visual

SublimeText3 versi Mac

SublimeText3 versi Mac

Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Topik panas

Tutorial Java
1670
14
Tutorial PHP
1274
29
Tutorial C#
1256
24
C# vs C: Sejarah, evolusi, dan prospek masa depan C# vs C: Sejarah, evolusi, dan prospek masa depan Apr 19, 2025 am 12:07 AM

Sejarah dan evolusi C# dan C adalah unik, dan prospek masa depan juga berbeza. 1.C dicipta oleh BjarnestroustRup pada tahun 1983 untuk memperkenalkan pengaturcaraan berorientasikan objek ke dalam bahasa C. Proses evolusinya termasuk pelbagai standardisasi, seperti C 11 memperkenalkan kata kunci auto dan ekspresi Lambda, C 20 memperkenalkan konsep dan coroutin, dan akan memberi tumpuan kepada pengaturcaraan prestasi dan sistem pada masa akan datang. 2.C# telah dikeluarkan oleh Microsoft pada tahun 2000. Menggabungkan kelebihan C dan Java, evolusinya memberi tumpuan kepada kesederhanaan dan produktiviti. Sebagai contoh, C#2.0 memperkenalkan generik dan C#5.0 memperkenalkan pengaturcaraan tak segerak, yang akan memberi tumpuan kepada produktiviti pemaju dan pengkomputeran awan pada masa akan datang.

C# vs C: Lembaran Lelajaran dan Pengalaman Pemaju C# vs C: Lembaran Lelajaran dan Pengalaman Pemaju Apr 18, 2025 am 12:13 AM

Terdapat perbezaan yang signifikan dalam lengkung pembelajaran C# dan C dan pengalaman pemaju. 1) Keluk pembelajaran C# agak rata dan sesuai untuk pembangunan pesat dan aplikasi peringkat perusahaan. 2) Keluk pembelajaran C adalah curam dan sesuai untuk senario kawalan berprestasi tinggi dan rendah.

C dan XML: Meneroka hubungan dan sokongan C dan XML: Meneroka hubungan dan sokongan Apr 21, 2025 am 12:02 AM

C Berinteraksi dengan XML melalui perpustakaan pihak ketiga (seperti TinyXML, PugixML, Xerces-C). 1) Gunakan perpustakaan untuk menghuraikan fail XML dan menukarnya ke dalam struktur data C-diproses. 2) Apabila menjana XML, tukar struktur data C ke format XML. 3) Dalam aplikasi praktikal, XML sering digunakan untuk fail konfigurasi dan pertukaran data untuk meningkatkan kecekapan pembangunan.

Apakah analisis statik dalam c? Apakah analisis statik dalam c? Apr 28, 2025 pm 09:09 PM

Penggunaan analisis statik di C terutamanya termasuk menemui masalah pengurusan memori, memeriksa kesilapan logik kod, dan meningkatkan keselamatan kod. 1) Analisis statik dapat mengenal pasti masalah seperti kebocoran memori, siaran berganda, dan penunjuk yang tidak dikenali. 2) Ia dapat mengesan pembolehubah yang tidak digunakan, kod mati dan percanggahan logik. 3) Alat analisis statik seperti perlindungan dapat mengesan limpahan penampan, limpahan integer dan panggilan API yang tidak selamat untuk meningkatkan keselamatan kod.

Bagaimana cara menggunakan Perpustakaan Chrono di C? Bagaimana cara menggunakan Perpustakaan Chrono di C? Apr 28, 2025 pm 10:18 PM

Menggunakan perpustakaan Chrono di C membolehkan anda mengawal selang masa dan masa dengan lebih tepat. Mari kita meneroka pesona perpustakaan ini. Perpustakaan Chrono C adalah sebahagian daripada Perpustakaan Standard, yang menyediakan cara moden untuk menangani selang waktu dan masa. Bagi pengaturcara yang telah menderita dari masa. H dan CTime, Chrono tidak diragukan lagi. Ia bukan sahaja meningkatkan kebolehbacaan dan mengekalkan kod, tetapi juga memberikan ketepatan dan fleksibiliti yang lebih tinggi. Mari kita mulakan dengan asas -asas. Perpustakaan Chrono terutamanya termasuk komponen utama berikut: STD :: Chrono :: System_Clock: Mewakili jam sistem, yang digunakan untuk mendapatkan masa semasa. Std :: Chron

Di luar gembar -gembur: Menilai kaitan C hari ini Di luar gembar -gembur: Menilai kaitan C hari ini Apr 14, 2025 am 12:01 AM

C masih mempunyai kaitan penting dalam pengaturcaraan moden. 1) Keupayaan operasi prestasi tinggi dan perkakasan langsung menjadikannya pilihan pertama dalam bidang pembangunan permainan, sistem tertanam dan pengkomputeran berprestasi tinggi. 2) Paradigma pengaturcaraan yang kaya dan ciri -ciri moden seperti penunjuk pintar dan pengaturcaraan templat meningkatkan fleksibiliti dan kecekapannya. Walaupun lengkung pembelajaran curam, keupayaannya yang kuat menjadikannya masih penting dalam ekosistem pengaturcaraan hari ini.

Masa Depan C: Adaptasi dan Inovasi Masa Depan C: Adaptasi dan Inovasi Apr 27, 2025 am 12:25 AM

Masa depan C akan memberi tumpuan kepada pengkomputeran selari, keselamatan, modularization dan pembelajaran AI/mesin: 1) Pengkomputeran selari akan dipertingkatkan melalui ciri -ciri seperti coroutine; 2) keselamatan akan diperbaiki melalui pemeriksaan jenis dan mekanisme pengurusan memori yang lebih ketat; 3) modulasi akan memudahkan organisasi dan penyusunan kod; 4) AI dan pembelajaran mesin akan mendorong C untuk menyesuaikan diri dengan keperluan baru, seperti pengkomputeran berangka dan sokongan pengaturcaraan GPU.

C: Adakah ia mati atau hanya berkembang? C: Adakah ia mati atau hanya berkembang? Apr 24, 2025 am 12:13 AM

C isnotdying; it'sevolving.1) c suplemenvantduetoitsverversatilityandeficiencyinperformance-criticalapplications.2) thelanguageiscontinuouslyupdated, withc 20introducingfeatureslikemodulesandcoroutinestoMproveusability.3)

See all articles