Rumah Peranti teknologi AI 22 bilion transistor, pemproses pembelajaran mesin IBM NorthPole, kecekapan tenaga meningkat sebanyak 25 kali ganda

22 bilion transistor, pemproses pembelajaran mesin IBM NorthPole, kecekapan tenaga meningkat sebanyak 25 kali ganda

Oct 23, 2023 pm 03:13 PM
projek northpole

IBM hadir lagi.


Dengan perkembangan pesat sistem AI, keperluan tenaga mereka juga semakin meningkat. Melatih sistem baharu memerlukan set data yang besar dan masa pemproses, menjadikannya sangat intensif tenaga. Dalam sesetengah kes, telefon pintar boleh melakukan tugas dengan mudah dengan melaksanakan beberapa sistem yang terlatih. Walau bagaimanapun, jika ia dilaksanakan terlalu banyak kali, penggunaan tenaga juga akan meningkat.

Nasib baik, terdapat banyak cara untuk mengurangkan penggunaan tenaga yang terakhir. IBM dan Intel telah bereksperimen dengan pemproses yang direka untuk meniru tingkah laku neuron sebenar. IBM juga menguji melaksanakan pengiraan rangkaian saraf dalam memori perubahan fasa untuk mengelakkan akses berulang kepada RAM.

Kini, IBM telah memperkenalkan kaedah lain. Pemproses NorthPole baharu syarikat itu mensintesis beberapa idea daripada pendekatan di atas dan menggabungkannya dengan cara yang sangat diperkemas untuk menjalankan pengiraan, mencipta cip cekap tenaga yang boleh melaksanakan rangkaian saraf berasaskan inferens dengan cekap. Cip adalah 35 kali lebih cekap daripada GPU dalam bidang seperti klasifikasi imej atau transkripsi audio.

22 bilion transistor, pemproses pembelajaran mesin IBM NorthPole, kecekapan tenaga meningkat sebanyak 25 kali ganda

Blog rasmi: https://research.ibm.com/blog/northpole-ibm-ai-chip

Perbezaan antara NorthPole dan pemprosesan AI tradisional Pemproses yang berbeza

semua, NorthPole tidak melakukan apa-apa untuk keperluan latihan rangkaian saraf, ia direka semata-mata untuk pelaksanaan.
Kedua, ia bukan pemproses AI tujuan umum, tetapi direka khusus untuk rangkaian saraf fokus inferens. Jadi, jika anda ingin menggunakannya untuk menaakul, ketahui kandungan imej atau klip audio, dsb., maka ia adalah betul. Tetapi jika anda perlu menjalankan model bahasa yang besar, cip ini nampaknya tidak begitu berguna.
Akhirnya, sementara NorthPole meminjam beberapa idea daripada cip pengkomputeran neuromorfik, ia bukanlah perkakasan neuromorfik kerana unit pemprosesannya melakukan pengiraan dan bukannya meniru komunikasi spiking yang digunakan oleh neuron sebenar.

NorthPole, seperti TrueNorth sebelum ini, terdiri daripada pelbagai besar sel pengiraan (16×16), setiap satu mengandungi memori tempatan dan keupayaan pelaksanaan kod. Oleh itu, semua berat pelbagai sambungan dalam rangkaian saraf boleh disimpan dengan tepat di mana ia diperlukan.

Ia juga menampilkan rangkaian pada cip yang luas, dengan sekurang-kurangnya empat rangkaian berbeza. Sesetengah rangkaian ini membawa maklumat tentang pengiraan yang telah siap ke unit pengkomputeran seterusnya yang memerlukannya. Rangkaian lain digunakan untuk mengkonfigurasi semula keseluruhan tatasusunan unit pengkomputeran, menyediakan berat neural dan kod yang diperlukan untuk melaksanakan satu lapisan rangkaian saraf sementara lapisan sebelumnya masih dikira. Akhir sekali, komunikasi antara unit pengkomputeran bersebelahan dioptimumkan. Ini berguna untuk perkara seperti mencari tepi objek dalam imej. Jika piksel bersebelahan diperuntukkan kepada unit pengkomputeran bersebelahan apabila imej dimasukkan, mereka boleh bekerjasama dengan lebih mudah untuk mengenal pasti ciri yang menjangkau piksel bersebelahan.

Selain itu, sumber pengkomputeran NorthPole juga luar biasa. Setiap unit dioptimumkan untuk melakukan pengiraan ketepatan yang lebih rendah, antara 2 bit hingga 8 bit. Untuk memastikan penggunaan unit pelaksanaan ini, mereka tidak boleh melaksanakan cawangan bersyarat berdasarkan nilai pembolehubah. Iaitu, kod pengguna tidak boleh mengandungi penyata if. Pelaksanaan mudah ini membolehkan pelaksanaan selari secara besar-besaran bagi setiap unit pengkomputeran. Pada ketepatan 2-bit, setiap unit boleh melakukan lebih daripada 8,000 pengiraan secara selari.

Perisian Pengiring

Disebabkan reka bentuk unik ini, pasukan NorthPole perlu membangunkan perisian latihan mereka sendiri untuk mengira tahap ketepatan minimum yang diperlukan untuk setiap lapisan untuk beroperasi dengan jayanya. Melaksanakan rangkaian saraf pada cip juga merupakan proses yang agak luar biasa.

Setelah pemberat dan sambungan rangkaian saraf diletakkan dalam penimbal pada cip, pelaksanaan hanya memerlukan pengawal luaran untuk memuat naik data yang ingin dijalankan dan menyuruhnya mula berjalan. Segala-galanya berjalan tanpa CPU, yang mengehadkan penggunaan kuasa peringkat sistem.

Cip ujian
NorthPole dihasilkan pada proses 12nm, yang jauh di belakang canggih. Namun, mereka berjaya memuatkan 256 unit pengkomputeran pada 22 bilion transistor, setiap satu dengan memori 768 KB. Apabila sistem dibandingkan dengan GPU Teras Tensor V100 Nvidia, yang dibina pada proses yang sama, NorthPole mempunyai 25 kali kuasa pengkomputeran pada penggunaan kuasa yang sama.

Di bawah keadaan yang sama, NorthPole mengungguli GPU terkini sebanyak lebih kurang lima kali ganda. Ujian sistem telah menunjukkan bahawa ia juga boleh melaksanakan pelbagai tugas rangkaian saraf yang digunakan secara meluas.

Atas ialah kandungan terperinci 22 bilion transistor, pemproses pembelajaran mesin IBM NorthPole, kecekapan tenaga meningkat sebanyak 25 kali ganda. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan Laman Web ini
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn

Alat AI Hot

Undresser.AI Undress

Undresser.AI Undress

Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover

AI Clothes Remover

Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool

Undress AI Tool

Gambar buka pakaian secara percuma

Clothoff.io

Clothoff.io

Penyingkiran pakaian AI

AI Hentai Generator

AI Hentai Generator

Menjana ai hentai secara percuma.

Artikel Panas

R.E.P.O. Kristal tenaga dijelaskan dan apa yang mereka lakukan (kristal kuning)
1 bulan yang lalu By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Tetapan grafik terbaik
1 bulan yang lalu By 尊渡假赌尊渡假赌尊渡假赌
Akan R.E.P.O. Ada Crossplay?
1 bulan yang lalu By 尊渡假赌尊渡假赌尊渡假赌

Alat panas

Notepad++7.3.1

Notepad++7.3.1

Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina

SublimeText3 versi Cina

Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1

Hantar Studio 13.0.1

Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6

Dreamweaver CS6

Alat pembangunan web visual

SublimeText3 versi Mac

SublimeText3 versi Mac

Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Pengarang ControlNet mendapat satu lagi kejayaan! Seluruh proses menghasilkan lukisan daripada gambar, memperoleh 1.4k bintang dalam masa dua hari Pengarang ControlNet mendapat satu lagi kejayaan! Seluruh proses menghasilkan lukisan daripada gambar, memperoleh 1.4k bintang dalam masa dua hari Jul 17, 2024 am 01:56 AM

Ia juga merupakan video Tusheng, tetapi PaintsUndo telah mengambil laluan yang berbeza. Pengarang ControlNet LvminZhang mula hidup semula! Kali ini saya menyasarkan bidang lukisan. Projek baharu PaintsUndo telah menerima 1.4kstar (masih meningkat secara menggila) tidak lama selepas ia dilancarkan. Alamat projek: https://github.com/lllyasviel/Paints-UNDO Melalui projek ini, pengguna memasukkan imej statik, dan PaintsUndo secara automatik boleh membantu anda menjana video keseluruhan proses mengecat, daripada draf baris hingga produk siap . Semasa proses lukisan, perubahan garisan adalah menakjubkan Hasil akhir video sangat serupa dengan imej asal: Mari kita lihat lukisan lengkap.

Mendahului senarai jurutera perisian AI sumber terbuka, penyelesaian tanpa ejen UIUC dengan mudah menyelesaikan masalah pengaturcaraan sebenar SWE-bench Mendahului senarai jurutera perisian AI sumber terbuka, penyelesaian tanpa ejen UIUC dengan mudah menyelesaikan masalah pengaturcaraan sebenar SWE-bench Jul 17, 2024 pm 10:02 PM

Lajur AIxiv ialah lajur di mana tapak ini menerbitkan kandungan akademik dan teknikal. Dalam beberapa tahun kebelakangan ini, lajur AIxiv laman web ini telah menerima lebih daripada 2,000 laporan, meliputi makmal terkemuka dari universiti dan syarikat utama di seluruh dunia, mempromosikan pertukaran dan penyebaran akademik secara berkesan. Jika anda mempunyai kerja yang sangat baik yang ingin anda kongsikan, sila berasa bebas untuk menyumbang atau hubungi kami untuk melaporkan. E-mel penyerahan: liyazhou@jiqizhixin.com; zhaoyunfeng@jiqizhixin.com Semua pengarang kertas kerja ini adalah daripada pasukan guru Zhang Lingming di Universiti Illinois di Urbana-Champaign (UIUC), termasuk: Steven Code repair; pelajar kedoktoran tahun empat, penyelidik

Kerja selepas kematian Pasukan Penyelarasan Super OpenAI: Dua model besar bermain permainan, dan output menjadi lebih mudah difahami Kerja selepas kematian Pasukan Penyelarasan Super OpenAI: Dua model besar bermain permainan, dan output menjadi lebih mudah difahami Jul 19, 2024 am 01:29 AM

Jika jawapan yang diberikan oleh model AI tidak dapat difahami sama sekali, adakah anda berani menggunakannya? Memandangkan sistem pembelajaran mesin digunakan dalam bidang yang lebih penting, menjadi semakin penting untuk menunjukkan sebab kita boleh mempercayai output mereka, dan bila tidak mempercayainya. Satu cara yang mungkin untuk mendapatkan kepercayaan dalam output sistem yang kompleks adalah dengan menghendaki sistem menghasilkan tafsiran outputnya yang boleh dibaca oleh manusia atau sistem lain yang dipercayai, iaitu, difahami sepenuhnya sehingga apa-apa ralat yang mungkin boleh dilakukan. dijumpai. Contohnya, untuk membina kepercayaan dalam sistem kehakiman, kami memerlukan mahkamah memberikan pendapat bertulis yang jelas dan boleh dibaca yang menjelaskan dan menyokong keputusan mereka. Untuk model bahasa yang besar, kita juga boleh menggunakan pendekatan yang sama. Walau bagaimanapun, apabila mengambil pendekatan ini, pastikan model bahasa menjana

Daripada RLHF kepada DPO kepada TDPO, algoritma penjajaran model besar sudah pun 'peringkat token' Daripada RLHF kepada DPO kepada TDPO, algoritma penjajaran model besar sudah pun 'peringkat token' Jun 24, 2024 pm 03:04 PM

Lajur AIxiv ialah lajur di mana tapak ini menerbitkan kandungan akademik dan teknikal. Dalam beberapa tahun kebelakangan ini, lajur AIxiv laman web ini telah menerima lebih daripada 2,000 laporan, meliputi makmal terkemuka dari universiti dan syarikat utama di seluruh dunia, mempromosikan pertukaran dan penyebaran akademik secara berkesan. Jika anda mempunyai kerja yang sangat baik yang ingin anda kongsikan, sila berasa bebas untuk menyumbang atau hubungi kami untuk melaporkan. E-mel penyerahan: liyazhou@jiqizhixin.com; zhaoyunfeng@jiqizhixin.com Dalam proses pembangunan kecerdasan buatan, kawalan dan bimbingan model bahasa besar (LLM) sentiasa menjadi salah satu cabaran utama, bertujuan untuk memastikan model ini adalah kedua-duanya. berkuasa dan selamat untuk masyarakat manusia. Usaha awal tertumpu kepada kaedah pembelajaran pengukuhan melalui maklum balas manusia (RL

Kertas arXiv boleh disiarkan sebagai 'bertubi-tubi', platform perbincangan Stanford alphaXiv dalam talian, LeCun menyukainya Kertas arXiv boleh disiarkan sebagai 'bertubi-tubi', platform perbincangan Stanford alphaXiv dalam talian, LeCun menyukainya Aug 01, 2024 pm 05:18 PM

sorakan! Bagaimana rasanya apabila perbincangan kertas adalah perkataan? Baru-baru ini, pelajar di Universiti Stanford mencipta alphaXiv, forum perbincangan terbuka untuk kertas arXiv yang membenarkan soalan dan ulasan disiarkan terus pada mana-mana kertas arXiv. Pautan laman web: https://alphaxiv.org/ Malah, tidak perlu melawati tapak web ini secara khusus. Hanya tukar arXiv dalam mana-mana URL kepada alphaXiv untuk terus membuka kertas yang sepadan di forum alphaXiv: anda boleh mencari perenggan dengan tepat dalam. kertas itu, Ayat: Dalam ruang perbincangan di sebelah kanan, pengguna boleh menyiarkan soalan untuk bertanya kepada pengarang tentang idea dan butiran kertas tersebut Sebagai contoh, mereka juga boleh mengulas kandungan kertas tersebut, seperti: "Diberikan kepada

Satu kejayaan ketara dalam Hipotesis Riemann! Tao Zhexuan amat mengesyorkan kertas kerja baharu daripada MIT dan Oxford, dan pemenang Fields Medal berusia 37 tahun mengambil bahagian Satu kejayaan ketara dalam Hipotesis Riemann! Tao Zhexuan amat mengesyorkan kertas kerja baharu daripada MIT dan Oxford, dan pemenang Fields Medal berusia 37 tahun mengambil bahagian Aug 05, 2024 pm 03:32 PM

Baru-baru ini, Hipotesis Riemann, yang dikenali sebagai salah satu daripada tujuh masalah utama milenium, telah mencapai kejayaan baharu. Hipotesis Riemann ialah masalah yang tidak dapat diselesaikan yang sangat penting dalam matematik, berkaitan dengan sifat tepat taburan nombor perdana (nombor perdana ialah nombor yang hanya boleh dibahagikan dengan 1 dan dirinya sendiri, dan ia memainkan peranan asas dalam teori nombor). Dalam kesusasteraan matematik hari ini, terdapat lebih daripada seribu proposisi matematik berdasarkan penubuhan Hipotesis Riemann (atau bentuk umumnya). Dalam erti kata lain, sebaik sahaja Hipotesis Riemann dan bentuk umumnya dibuktikan, lebih daripada seribu proposisi ini akan ditetapkan sebagai teorem, yang akan memberi kesan yang mendalam terhadap bidang matematik dan jika Hipotesis Riemann terbukti salah, maka antara cadangan ini sebahagian daripadanya juga akan kehilangan keberkesanannya. Kejayaan baharu datang daripada profesor matematik MIT Larry Guth dan Universiti Oxford

Latihan aksiomatik membolehkan LLM mempelajari penaakulan kausal: model 67 juta parameter adalah setanding dengan trilion tahap parameter GPT-4 Latihan aksiomatik membolehkan LLM mempelajari penaakulan kausal: model 67 juta parameter adalah setanding dengan trilion tahap parameter GPT-4 Jul 17, 2024 am 10:14 AM

Tunjukkan rantai sebab kepada LLM dan ia mempelajari aksiom. AI sudah pun membantu ahli matematik dan saintis menjalankan penyelidikan Contohnya, ahli matematik terkenal Terence Tao telah berulang kali berkongsi pengalaman penyelidikan dan penerokaannya dengan bantuan alatan AI seperti GPT. Untuk AI bersaing dalam bidang ini, keupayaan penaakulan sebab yang kukuh dan boleh dipercayai adalah penting. Penyelidikan yang akan diperkenalkan dalam artikel ini mendapati bahawa model Transformer yang dilatih mengenai demonstrasi aksiom transitiviti sebab pada graf kecil boleh digeneralisasikan kepada aksiom transitiviti pada graf besar. Dalam erti kata lain, jika Transformer belajar untuk melakukan penaakulan sebab yang mudah, ia boleh digunakan untuk penaakulan sebab yang lebih kompleks. Rangka kerja latihan aksiomatik yang dicadangkan oleh pasukan adalah paradigma baharu untuk pembelajaran penaakulan sebab berdasarkan data pasif, dengan hanya demonstrasi

MLLM berasaskan Mamba yang pertama ada di sini! Berat model, kod latihan, dsb. semuanya telah menjadi sumber terbuka MLLM berasaskan Mamba yang pertama ada di sini! Berat model, kod latihan, dsb. semuanya telah menjadi sumber terbuka Jul 17, 2024 am 02:46 AM

Lajur AIxiv ialah lajur di mana tapak ini menerbitkan kandungan akademik dan teknikal. Dalam beberapa tahun kebelakangan ini, lajur AIxiv laman web ini telah menerima lebih daripada 2,000 laporan, meliputi makmal terkemuka dari universiti dan syarikat utama di seluruh dunia, mempromosikan pertukaran dan penyebaran akademik secara berkesan. Jika anda mempunyai kerja yang sangat baik yang ingin anda kongsikan, sila berasa bebas untuk menyumbang atau hubungi kami untuk melaporkan. E-mel penyerahan: liyazhou@jiqizhixin.com; zhaoyunfeng@jiqizhixin.com. Pengenalan Dalam beberapa tahun kebelakangan ini, aplikasi model bahasa besar multimodal (MLLM) dalam pelbagai bidang telah mencapai kejayaan yang luar biasa. Walau bagaimanapun, sebagai model asas untuk banyak tugas hiliran, MLLM semasa terdiri daripada rangkaian Transformer yang terkenal, yang

See all articles