Rumah php教程 php手册 多核编程中的负载平衡难题

多核编程中的负载平衡难题

Jun 21, 2016 am 08:57 AM
cpu

  多核CPU中,要很好地发挥出多个CPU的性能的话,必须保证分配到各个CPU上的任务有一个很好的负载平衡。否则一些CPU在运行,另外一些CPU处于空闲,无法发挥出多核CPU的优势来。


  要实现一个好的负载平衡通常有两种方案,一种是静态负载平衡,另外一种是动态负载平衡。


  1、静态负载平衡


  静态负载平衡中,需要人工将程序分割成多个可并行执行的部分,并且要保证分割成的各个部分能够均衡地分布到各个CPU上运行,也就是说工作量要在多个任务间进行均匀的分配,使得达到高的加速系数。


  静态负载平衡问题从数学上来说是一个NP完全性问题,Richard M. Karp, Jeffrey D. Ullman, Christos H. Papadimitriou, M. Garey, D. Johnson等人相继在1972年到1983年间证明了静态负载问题在几种不同约束条件下的NP完全性。


  虽然NP完全性问题在数学上是难题,但是这并不是标题中所说的难题,因为NP完全性问题一般都可以找到很有效的近似算法来解决。


  2、动态负载平衡


  动态负载平衡是在程序的运行过程中来进行任务的分配达到负载平衡的目的。实际情况中存在许多不能由静态负载平衡解决的问题,比如一个大的循环中,循环的次数是由外部输入的,事先并不知道循环的次数,此时采用静态负载平衡划分策略就很难实现负载平衡。


  动态负载平衡中对任务的调度一般是由系统来实现的,程序员通常只能选择动态平衡的调度策略,不能修改调度策略,由于实际任务中存在很多的不确定因素,调度算法无法做得很优,因此动态负载平衡有时可能达不到既定的负载平衡要求。


  3、负载平衡的难题在那里?


  负载平衡的难题并不在于负载平衡的程度要达到多少,因为即使在各个CPU上分配的任务执行时间存在一些差距,但是随着CPU核数的增多总能让总的执行时间下降,从而使加速系数随CPU核数的增加而增加。


  负载平衡的困难之处在于程序中的可并行执行块很多要靠程序员来划分,当然CPU核数较少时,比如双核或4核,这种划分并不是很困难。但随着核数的增加,划分的粒度将变得越来越细,到了16核以上时,估计程序员要为如何划分任务而抓狂。比如一段顺序执行的代码,放到128核的CPU上运行,要手工划分成128个任务,其划分的难度可想而知。


  负载划分的误差会随着CPU核数的增加而放大,比如一个需要16个时间单位的程序分到4个任务上执行,平均每个任务上的负载执行时间为4个时间单位,划分误差为1个时间单位的话,那么加速系数变成 16/(4+1)=3.2,是理想情况下加速系数 4的80%。但是如果放到一个16核CPU上运行的话,如果某个任务的划分误差如果为0.5个时间单位的话,那么加速系数变成16/(1+0.5) = 10.67,只有理想的加速系数16的66.7%,如果核数再增加的话,由于误差的放大,加速系数相比于理想加速系数的比例还会下降。


  负载划分的难题还体现在CPU和软件的升级上,比如在4核CPU上的负载划分是均衡的,但到了8核、16核上,负载也许又变得不均衡了。软件升级也一样,当软件增加功能后,负载平衡又会遭到破坏,又需要重新划分负载使其达到平衡,这样一来软件设计的难度和麻烦大大增加了。


  如果使用了锁的话,一些看起来是均衡的负载也可能会由于锁竞争变得不平衡起来。


  4、负载平衡的应对策略


  对于运算量较小的软件,即使放到单核CPU上运行速度也很快,负载平衡做得差一些并没有太大影响,实际中负载平衡要考虑的是大运算量和规模很大的软件,这些软件需要在多核上进行负载平衡才能较好地利用多核来提高性能。


  对于大规模的软件,负载平衡方面采取的应对策略是发展划分并行块的宏观划分方法,从整个软件系统层面来进行划分,而不是象传统的针对某些局部的程序和算法来进行并行分解,因为局部的程序通常都很难分解成几十个以上的任务来运行。


   另外一个应对策略是在工具层面的,也就是编译工具能够协助人工进行并行块的分解,并找出良好的分解方案来,这方面Intel已经作出了一些努力,但是还需要更多的努力让工具的功能更强大一些才能应对核数较多时的情况。



Kenyataan Laman Web ini
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn

Alat AI Hot

Undresser.AI Undress

Undresser.AI Undress

Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover

AI Clothes Remover

Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool

Undress AI Tool

Gambar buka pakaian secara percuma

Clothoff.io

Clothoff.io

Penyingkiran pakaian AI

Video Face Swap

Video Face Swap

Tukar muka dalam mana-mana video dengan mudah menggunakan alat tukar muka AI percuma kami!

Alat panas

Notepad++7.3.1

Notepad++7.3.1

Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina

SublimeText3 versi Cina

Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1

Hantar Studio 13.0.1

Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6

Dreamweaver CS6

Alat pembangunan web visual

SublimeText3 versi Mac

SublimeText3 versi Mac

Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Apakah penggunaan CPU yang sepatutnya semasa bermain permainan? Apakah penggunaan CPU yang sepatutnya semasa bermain permainan? Feb 19, 2024 am 11:21 AM

Adalah perkara biasa bagi permainan untuk memperlahankan komputer anda kerana ia menggunakan banyak sumber. Adalah penting untuk memahami penggunaan CPU anda semasa bermain permainan supaya anda boleh mengelak daripada membebankannya. Oleh itu, menjejaki penggunaan CPU yang sesuai adalah kunci untuk memastikan pengalaman permainan anda lancar. Dalam artikel ini, kami akan melihat penggunaan CPU yang sesuai yang perlu anda capai semasa permainan anda sedang berjalan. Penggunaan CPU semasa penggunaan CPU permainan ialah penunjuk penting beban kerja pemproses dan bergantung pada spesifikasi prestasi CPU. CPU yang lebih berkuasa biasanya mempunyai penggunaan yang lebih tinggi. CPU dengan lebih banyak teras dan benang boleh meningkatkan prestasi keseluruhan sistem anda. Sokongan berbilang benang membantu melepaskan potensi penuh CPU anda. Dalam permainan, penggunaan CPU bergantung pada penggunaan pemproses, yang boleh menjejaskan permainan

Bagaimana untuk menetapkan prestasi CPU kepada penuh dalam Win11 Bagaimana untuk menetapkan prestasi CPU kepada penuh dalam Win11 Feb 19, 2024 pm 07:42 PM

Ramai pengguna mendapati bahawa komputer tidak berjalan dengan lancar apabila menggunakan sistem Win11 Mereka ingin meningkatkan prestasi CPU, tetapi mereka tidak tahu bagaimana untuk melakukannya. Berikut akan memperkenalkan secara terperinci cara menetapkan prestasi CPU ke tahap tertinggi dalam sistem Win11 untuk menjadikan komputer anda lebih cekap. Kaedah tetapan: 1. Klik kanan "PC ini" pada desktop dan pilih "Properties" dalam senarai pilihan. 2. Selepas memasuki antara muka baharu, klik "Tetapan Sistem Lanjutan" dalam "Pautan Berkaitan". 3. Dalam tetingkap yang terbuka, klik tab "Lanjutan" di bahagian atas, kemudian klik & di bahagian bawah "Prestasi"

Bagaimana untuk meningkatkan kekerapan jam CPU komputer anda Bagaimana untuk meningkatkan kekerapan jam CPU komputer anda Feb 20, 2024 am 09:54 AM

Cara Overclock CPU Komputer Dengan kemajuan teknologi yang berterusan, permintaan orang ramai terhadap prestasi komputer juga semakin tinggi. Cara yang berkesan untuk meningkatkan prestasi komputer adalah dengan meningkatkan kekerapan operasi CPU melalui overclocking. Overclocking membolehkan CPU memproses data dengan lebih pantas, memberikan kuasa pengkomputeran yang lebih tinggi. Jadi, bagaimana untuk overclock CPU komputer? Berikut akan memperkenalkan anda kepada prinsip asas dan kaedah operasi khusus overclocking. Mula-mula, mari kita fahami cara kerja overclocking. Kekerapan operasi CPU ditentukan oleh pengayun kristal pada papan induk

Perbezaan antara cpu kotak dan pukal Perbezaan antara cpu kotak dan pukal Jan 23, 2024 am 09:46 AM

Perbezaan antara CPU berkotak dan pukal: 1. Kualiti 2. Tempoh jaminan 4. Harga; Pengenalan terperinci: 1. Kualiti, sama ada dalam kotak atau pukal, tiada perbezaan dalam kualiti CPU itu sendiri, semuanya dihasilkan oleh pengilang yang sama dan menjalani ujian kualiti dan proses kawalan kualiti; CPU berkotak Tempoh waranti yang lebih lama biasanya disediakan, biasanya tiga tahun, manakala CPU pukal biasanya hanya mempunyai waranti satu tahun, ini kerana CPU berkotak biasanya dijual oleh peniaga rasmi atau sah, dsb.

Bagaimana untuk undervolt dan overclock CPU anda menggunakan Intel XTU Bagaimana untuk undervolt dan overclock CPU anda menggunakan Intel XTU Feb 19, 2024 am 11:06 AM

Intel XTU ialah aplikasi berkuasa yang membolehkan anda mengurus prestasi komputer anda dengan mudah. Anda boleh membetulkan isu terlalu panas dengan melaraskan voltan CPU atau meningkatkan prestasi dengan melakukan overclocking. Dalam artikel ini, kita akan melihat bagaimana anda boleh memanfaatkan Intel XTU untuk mengoptimumkan prestasi komputer anda, sama ada melaraskan voltan atau overclocking. Apakah kesan undervolting dan overclocking pada CPU? Sebelum kita terus belajar bagaimana untuk undervolt dan overclock CPU, kita perlu memahami dahulu apa itu. Undervolting merujuk kepada pengurangan voltan yang diperlukan oleh CPU secara beransur-ansur. Proses ini membantu mengurangkan pelepasan haba, kerana voltan tinggi menghasilkan suhu yang lebih tinggi. Dengan mengurangkan bekalan voltan ke CPU, suhu boleh dikurangkan dengan berkesan. Jika komputer riba anda mula perlahan selepas menjadi panas, anda harus menyelesaikan masalah itu dengan segera.

Proses operasi hos perkhidmatan WIN10 yang menduduki terlalu banyak CPU Proses operasi hos perkhidmatan WIN10 yang menduduki terlalu banyak CPU Mar 27, 2024 pm 02:41 PM

1. Mula-mula, kita klik kanan ruang kosong bar tugas dan pilih pilihan [Task Manager], atau klik kanan logo mula, dan kemudian pilih pilihan [Task Manager]. 2. Dalam antara muka Pengurus Tugas yang dibuka, kami klik tab [Perkhidmatan] di hujung kanan. 3. Dalam tab [Perkhidmatan] yang dibuka, klik pilihan [Buka Perkhidmatan] di bawah. 4. Dalam tetingkap [Services] yang terbuka, klik kanan perkhidmatan [InternetConnectionSharing(ICS)], dan kemudian pilih pilihan [Properties]. 5. Dalam tetingkap sifat yang terbuka, tukar [Buka dengan] kepada [Disabled], klik [Apply] dan kemudian klik [OK]. 6. Klik logo mula, kemudian klik butang tutup, pilih [Mulakan Semula], dan selesaikan mula semula komputer.

144-teras, SRAM bertindan 3D: Fujitsu memperincikan pemproses pusat data generasi akan datang MONAKA 144-teras, SRAM bertindan 3D: Fujitsu memperincikan pemproses pusat data generasi akan datang MONAKA Jul 29, 2024 am 11:40 AM

Menurut berita dari laman web ini pada 28 Julai, media asing TechRader melaporkan bahawa Fujitsu memperkenalkan secara terperinci pemproses FUJITSU-MONAKA (selepas ini dirujuk sebagai MONAKA) yang dirancang untuk dihantar pada 2027. MONAKACPU adalah berdasarkan seni bina "3D asli awan" dan menggunakan set arahan Arm Ia berorientasikan pusat data, tepi dan medan telekomunikasi Ia sesuai untuk pengkomputeran AI dan boleh merealisasikan RAS1 peringkat kerangka utama. Fujitsu berkata bahawa MONAKA akan mencapai lonjakan dalam kecekapan dan prestasi tenaga: terima kasih kepada teknologi seperti teknologi voltan ultra-rendah (ULV), CPU boleh mencapai kecekapan tenaga 2 kali ganda produk pesaing pada tahun 2027, dan penyejukan tidak memerlukan penyejukan air. ; sebagai tambahan, prestasi aplikasi pemproses Ia juga boleh mencapai dua kali lebih banyak daripada lawan anda. Dari segi arahan, MONAKA dilengkapi dengan vektor

Kebocoran mendedahkan spesifikasi utama Intel Arrow Lake-U, -H, -HX dan -S Kebocoran mendedahkan spesifikasi utama Intel Arrow Lake-U, -H, -HX dan -S Jun 15, 2024 pm 09:49 PM

IntelArrowLake dijangka akan dibebaskan pada seni bina pemproses yang sama sebagai LunarLake, yang bermaksud bahawa teras prestasi LionCoveIntel yang baru akan digabungkan dengan teras kecekapan Skymonte yang ekonomi.

See all articles