Bagaimana untuk melaksanakan pengkomputeran selari kod C++?
Dengan peningkatan berterusan prestasi perkakasan komputer, pengkomputeran selari untuk pemproses berbilang teras telah menjadi topik penting dalam bidang pengaturcaraan. Sebagai bahasa pengaturcaraan yang cekap, C++ secara semula jadi mempunyai pelbagai kaedah untuk melaksanakan pengkomputeran selari. Artikel ini akan memperkenalkan beberapa kaedah pengkomputeran selari C++ yang biasa digunakan dan masing-masing menunjukkan pelaksanaan kod dan senario penggunaannya.
- OpenMP
OpenMP ialah API pengkomputeran selari berasaskan memori dikongsi yang boleh menambah kod selari pada program C++ dengan mudah. Ia menggunakan arahan #pragma untuk mengenal pasti segmen kod yang perlu diselaraskan dan menyediakan satu siri fungsi perpustakaan untuk melaksanakan pengkomputeran selari. Berikut ialah contoh program OpenMP yang mudah:
#include <iostream> #include <omp.h> using namespace std; int main() { int data[1000], i, sum = 0; for (i=0;i<1000;i++){ data[i] = i+1; } #pragma omp parallel for reduction(+:sum) for (i=0;i<1000;i++){ sum += data[i]; } cout << "Sum: " << sum << endl; return 0; }
Dalam contoh ini, arahan #pragma omp digunakan untuk menyelaraskan gelung for. Pada masa yang sama, gunakan arahan pengurangan(+:sum) untuk memberitahu OpenMP untuk menambah pembolehubah jumlah. Apabila program ini dijalankan pada komputer menggunakan 4 teras, anda dapat melihat bahawa masa berjalan adalah 3-4 kali lebih cepat daripada versi single-threaded.
- MPI
MPI ialah antara muka penghantaran mesej yang membolehkan pengkomputeran selari teragih antara berbilang komputer. Unit asas program MPI ialah proses, dan setiap proses dilaksanakan dalam ruang memori bebas. Program MPI boleh dijalankan pada satu komputer atau pada berbilang komputer. Berikut ialah program sampel asas MPI:
#include <iostream> #include <mpi.h> using namespace std; int main(int argc, char** argv) { int rank, size; MPI_Init(&argc, &argv); MPI_Comm_rank(MPI_COMM_WORLD, &rank); MPI_Comm_size(MPI_COMM_WORLD, &size); cout << "Hello world from rank " << rank << " of " << size << endl; MPI_Finalize(); return 0; }
Dalam contoh ini, persekitaran MPI dimulakan melalui fungsi MPI_Init() dan fungsi MPI_Comm_rank() dan MPI_Comm_size() digunakan untuk mendapatkan nombor proses bagi satu proses dan jumlah keseluruhan proses. Di sini saya hanya mengeluarkan ayat Dengan melaksanakan arahan mpirun -np 4, program ini boleh dijalankan pada 4 proses.
- TBB
Intel Threading Building Blocks (TBB) ialah perpustakaan C++ yang menyediakan alatan untuk memudahkan pengkomputeran selari. Konsep utama TBB ialah tugasan, yang menyelaraskan beberapa kerja melalui kerjasama antara nod dan tugasan. Berikut ialah program contoh TBB:
#include <iostream> #include <tbb/tbb.h> using namespace std; class Sum { public: Sum() : sum(0) {} Sum(Sum& s, tbb::split) : sum(0) {} void operator()(const tbb::blocked_range<int>& r) { for (int i=r.begin();i!=r.end();i++){ sum += i; } } void join(Sum&s) { sum += s.sum; } int getSum() const { return sum; } private: int sum; }; int main() { Sum s; tbb::parallel_reduce(tbb::blocked_range<int>(0, 1000), s); cout << "Sum: " << s.getSum() << endl; return 0; }
Dalam contoh ini, kelas Sum ditakrifkan untuk melaksanakan pengkomputeran selari, tbb::blocked_range
Ketiga-tiga kaedah ini masing-masing mempunyai kelebihan dan keburukan masing-masing kaedah yang mana untuk dipilih terutamanya bergantung pada senario aplikasi tertentu. OpenMP sesuai untuk digunakan pada mesin tunggal dengan memori yang dikongsi, dan boleh menambah kod selari dengan mudah pada program C++ sedia ada untuk menjadikan program berjalan lebih pantas. MPI sesuai untuk digunakan pada kelompok pengkomputeran teragih dan boleh mencapai kesejajaran dengan menghantar mesej antara berbilang komputer. TBB ialah perpustakaan C++ merentas platform yang menyediakan beberapa alatan yang cekap untuk memudahkan pengkomputeran selari.
Ringkasnya, untuk aplikasi yang memerlukan pengkomputeran selari, C++ menyediakan pelbagai pilihan untuk mencapai kesejajaran yang cekap. Pembangun boleh memilih satu atau lebih kaedah untuk mencapai tugas mereka berdasarkan keperluan dan senario aplikasi mereka sendiri, dan meningkatkan prestasi program ke tahap yang baharu.
Atas ialah kandungan terperinci Bagaimana untuk melaksanakan pengkomputeran selari kod C++?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Alat AI Hot

Undresser.AI Undress
Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover
Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool
Gambar buka pakaian secara percuma

Clothoff.io
Penyingkiran pakaian AI

Video Face Swap
Tukar muka dalam mana-mana video dengan mudah menggunakan alat tukar muka AI percuma kami!

Artikel Panas

Alat panas

Notepad++7.3.1
Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina
Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1
Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6
Alat pembangunan web visual

SublimeText3 versi Mac
Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Topik panas

Dalam C, jenis char digunakan dalam rentetan: 1. Simpan satu watak; 2. Gunakan array untuk mewakili rentetan dan berakhir dengan terminator null; 3. Beroperasi melalui fungsi operasi rentetan; 4. Baca atau output rentetan dari papan kekunci.

Pengiraan C35 pada dasarnya adalah matematik gabungan, yang mewakili bilangan kombinasi yang dipilih dari 3 dari 5 elemen. Formula pengiraan ialah C53 = 5! / (3! * 2!), Yang boleh dikira secara langsung oleh gelung untuk meningkatkan kecekapan dan mengelakkan limpahan. Di samping itu, memahami sifat kombinasi dan menguasai kaedah pengiraan yang cekap adalah penting untuk menyelesaikan banyak masalah dalam bidang statistik kebarangkalian, kriptografi, reka bentuk algoritma, dll.

Multithreading dalam bahasa dapat meningkatkan kecekapan program. Terdapat empat cara utama untuk melaksanakan multithreading dalam bahasa C: Buat proses bebas: Buat pelbagai proses berjalan secara bebas, setiap proses mempunyai ruang ingatan sendiri. Pseudo-Multithreading: Buat pelbagai aliran pelaksanaan dalam proses yang berkongsi ruang memori yang sama dan laksanakan secara bergantian. Perpustakaan multi-threaded: Gunakan perpustakaan berbilang threaded seperti PTHREADS untuk membuat dan mengurus benang, menyediakan fungsi operasi benang yang kaya. Coroutine: Pelaksanaan pelbagai threaded ringan yang membahagikan tugas menjadi subtask kecil dan melaksanakannya pada gilirannya.

STD :: Unik menghilangkan elemen pendua bersebelahan di dalam bekas dan menggerakkannya ke akhir, mengembalikan iterator yang menunjuk ke elemen pendua pertama. STD :: Jarak mengira jarak antara dua iterators, iaitu bilangan elemen yang mereka maksudkan. Kedua -dua fungsi ini berguna untuk mengoptimumkan kod dan meningkatkan kecekapan, tetapi terdapat juga beberapa perangkap yang perlu diberi perhatian, seperti: STD :: Unik hanya berkaitan dengan unsur -unsur pendua yang bersebelahan. STD :: Jarak kurang cekap apabila berurusan dengan Iterator Akses Bukan Rawak. Dengan menguasai ciri -ciri dan amalan terbaik ini, anda boleh menggunakan sepenuhnya kuasa kedua -dua fungsi ini.

Fungsi Release_semaphore dalam C digunakan untuk melepaskan semaphore yang diperoleh supaya benang atau proses lain dapat mengakses sumber yang dikongsi. Ia meningkatkan kiraan semaphore dengan 1, yang membolehkan benang menyekat untuk meneruskan pelaksanaan.

Dalam bahasa C, nomenclature ular adalah konvensyen gaya pengekodan, yang menggunakan garis bawah untuk menyambungkan beberapa perkataan untuk membentuk nama pembolehubah atau nama fungsi untuk meningkatkan kebolehbacaan. Walaupun ia tidak akan menjejaskan kompilasi dan operasi, penamaan panjang, isu sokongan IDE, dan bagasi sejarah perlu dipertimbangkan.

DEV-C 4.9.9.2 Kesilapan dan Penyelesaian Penyusunan Apabila menyusun program dalam sistem Windows 11 menggunakan dev-C 4.9.9.2, panel rekod pengkompil boleh memaparkan mesej ralat berikut: gcc.exe: internalerror: dibatalkan (programcollect2) PleaseSubmitafullbugreport.seeforinstructions. Walaupun "kompilasi berjaya", program sebenar tidak dapat dijalankan dan mesej ralat "Arkib kod asal tidak dapat disusun" muncul. Ini biasanya kerana penghubung mengumpul

C sesuai untuk pengaturcaraan sistem dan interaksi perkakasan kerana ia menyediakan keupayaan kawalan dekat dengan perkakasan dan ciri-ciri kuat pengaturcaraan berorientasikan objek. 1) C melalui ciri-ciri peringkat rendah seperti penunjuk, pengurusan memori dan operasi bit, operasi peringkat sistem yang cekap dapat dicapai. 2) Interaksi perkakasan dilaksanakan melalui pemacu peranti, dan C boleh menulis pemandu ini untuk mengendalikan komunikasi dengan peranti perkakasan.
