Rumah Peranti teknologi AI Fikiran dingin di bawah kegilaan ChatGPT: Penggunaan tenaga AI pada 2025 mungkin melebihi penggunaan manusia, dan pengkomputeran AI perlu meningkatkan kualiti dan kecekapan

Fikiran dingin di bawah kegilaan ChatGPT: Penggunaan tenaga AI pada 2025 mungkin melebihi penggunaan manusia, dan pengkomputeran AI perlu meningkatkan kualiti dan kecekapan

Apr 12, 2023 am 09:43 AM
ai chatgpt

Selepas bertahun-tahun pembangunan, sistem AI generatif DALL-E dan GPT-3 yang dilancarkan oleh OpenAI telah menjadi popular di seluruh dunia dan pada masa ini menonjolkan potensi aplikasi mereka yang menakjubkan. Walau bagaimanapun, terdapat masalah dengan letupan AI generatif ini: setiap kali DALL-E mencipta imej atau GPT-3 meramalkan perkataan seterusnya, ia memerlukan berbilang pengiraan inferens, sekali gus mengambil banyak sumber dan Menggunakan lebih banyak elektrik. Seni bina GPU dan CPU semasa tidak dapat beroperasi dengan cekap untuk memenuhi permintaan pengkomputeran yang akan berlaku, mewujudkan cabaran besar untuk pengendali pusat data skala besar.

Fikiran dingin di bawah kegilaan ChatGPT: Penggunaan tenaga AI pada 2025 mungkin melebihi penggunaan manusia, dan pengkomputeran AI perlu meningkatkan kualiti dan kecekapan

Institusi penyelidikan meramalkan bahawa pusat data telah menjadi pengguna tenaga terbesar di dunia, menyumbang 3% daripada jumlah penggunaan elektrik pada 2017, meningkat kepada 4.5% pada 2025. %. Mengambil China sebagai contoh, penggunaan elektrik pusat data yang beroperasi di seluruh negara dijangka melebihi 400 bilion kWj pada 2030, menyumbang 4% daripada jumlah penggunaan elektrik negara.

Pembekal pengkomputeran awan juga menyedari bahawa pusat data mereka menggunakan sejumlah besar tenaga elektrik dan telah mengambil langkah untuk meningkatkan kecekapan, seperti membina dan mengendalikan pusat data di Artik untuk memanfaatkan tenaga boleh diperbaharui dan keadaan penyejukan semula jadi. Walau bagaimanapun, ini tidak mencukupi untuk memenuhi pertumbuhan pesat aplikasi AI.

Makmal Kebangsaan Lawrence Berkeley di Amerika Syarikat mendapati dalam penyelidikan bahawa peningkatan dalam kecekapan pusat data telah mengawal pertumbuhan penggunaan tenaga sejak 20 tahun lalu, tetapi penyelidikan menunjukkan bahawa langkah kecekapan tenaga semasa mungkin tidak mencukupi untuk memenuhi keperluan pusat data masa hadapan, oleh itu pendekatan yang lebih baik diperlukan.

Penghantaran data ialah kesesakan yang membawa maut

Punca kecekapan terletak pada cara GPU dan CPU berfungsi, terutamanya apabila menjalankan model inferens AI dan model latihan. Ramai orang memahami "melangkaui Undang-undang Moore" dan batasan fizikal untuk membungkus lebih banyak transistor pada saiz cip yang lebih besar. Cip yang lebih maju membantu menyelesaikan cabaran ini, tetapi penyelesaian semasa mempunyai kelemahan utama apabila ia datang kepada inferens AI: kelajuan berkurangan dengan ketara di mana data boleh dipindahkan dalam memori akses rawak.

Secara tradisinya, mengasingkan pemproses dan cip memori adalah lebih murah, dan selama bertahun-tahun, kelajuan jam pemproses telah menjadi faktor pengehad utama dalam prestasi komputer. Hari ini, apa yang menghalang kemajuan ialah hubungan antara cip.

Jeff Shainline, seorang penyelidik di Institut Piawaian dan Teknologi Kebangsaan (NIST), menjelaskan: "Apabila memori dan pemproses dipisahkan, pautan komunikasi yang menghubungkan dua domain menjadi halangan utama sistem." Jack Dongarra, seorang penyelidik di Oak Ridge National Laboratory di Amerika Syarikat, berkata dengan ringkas: "Apabila kita melihat prestasi komputer hari ini, kita dapati penghantaran data adalah kesesakan yang membawa maut." inferens vs. latihan AI

Sistem AI menggunakan jenis pengiraan yang berbeza apabila melatih model AI berbanding menggunakan model AI untuk membuat ramalan. Latihan AI memuatkan puluhan ribu sampel imej atau teks ke dalam model berasaskan Transformer sebagai rujukan, dan kemudian mula memproses. Beribu-ribu teras dalam GPU memproses set data yang besar dan kaya seperti imej atau video dengan sangat cekap, dan jika anda memerlukan hasil yang lebih cepat, lebih banyak GPU berasaskan awan boleh disewa.

Walaupun inferens AI memerlukan lebih sedikit tenaga untuk melakukan pengiraan, dalam pelengkapan automatik oleh ratusan juta pengguna, banyak pengiraan dan ramalan diperlukan untuk menentukan perkataan yang seterusnya Apa, ini menggunakan lebih banyak tenaga daripada latihan jangka panjang. Fikiran dingin di bawah kegilaan ChatGPT: Penggunaan tenaga AI pada 2025 mungkin melebihi penggunaan manusia, dan pengkomputeran AI perlu meningkatkan kualiti dan kecekapan

Sebagai contoh, sistem AI Facebook memerhatikan trilion inferens dalam pusat datanya setiap hari, jumlah yang meningkat lebih daripada dua kali ganda dalam tempoh tiga tahun yang lalu. Penyelidikan telah mendapati bahawa menjalankan inferens terjemahan bahasa pada model bahasa besar (LLM) menggunakan dua hingga tiga kali lebih banyak tenaga daripada latihan awal.

Lonjakan permintaan menguji kecekapan pengkomputeran

ChatGPT menjadi popular di seluruh dunia pada penghujung tahun lalu, dan GPT-4 lebih mengagumkan. Jika kaedah yang lebih cekap tenaga boleh diterima pakai, inferens AI boleh diperluaskan kepada rangkaian peranti yang lebih luas dan mencipta cara pengkomputeran baharu.

Sebagai contoh, Gelung Hibrid Microsoft direka untuk membina pengalaman AI yang memanfaatkan pengkomputeran awan dan peranti tepi secara dinamik Ini membolehkan pembangun membuat keputusan peringkat akhir semasa menjalankan inferens AI pada platform awan Azure, komputer pelanggan tempatan. atau peranti mudah alih mengikat keputusan untuk memaksimumkan kecekapan. Facebook memperkenalkan AutoScale untuk membantu pengguna membuat keputusan dengan cekap di mana untuk mengira inferens pada masa jalan.

Untuk meningkatkan kecekapan, adalah perlu untuk mengatasi halangan yang menghalang pembangunan AI dan mencari kaedah yang berkesan.

Pensampelan dan saluran paip boleh mempercepatkan pembelajaran mendalam dengan mengurangkan jumlah data yang diproses. SALIENT (untuk Persampelan, Penghirisan dan Pergerakan Data) ialah pendekatan baharu yang dibangunkan oleh penyelidik di MIT dan IBM untuk menangani kesesakan kritikal. Pendekatan ini boleh mengurangkan dengan ketara keperluan untuk menjalankan rangkaian saraf pada set data besar yang mengandungi 100 juta nod dan 1 bilion tepi. Tetapi ia juga menjejaskan ketepatan dan ketepatan—yang boleh diterima untuk memilih siaran sosial seterusnya untuk dipaparkan, tetapi tidak jika cuba mengenal pasti keadaan tidak selamat di tapak kerja dalam masa hampir nyata.

Syarikat teknologi seperti Apple, Nvidia, Intel dan AMD telah mengumumkan penyepaduan enjin AI khusus ke dalam pemproses, malah AWS sedang membangunkan pemproses Inferentia 2 baharu. Tetapi penyelesaian ini masih menggunakan seni bina pemproses von Neumann tradisional, SRAM bersepadu dan memori DRAM luaran - semuanya memerlukan lebih kuasa untuk memindahkan data masuk dan keluar dari memori.

Pengkomputeran dalam memori mungkin penyelesaiannya

Selain itu, penyelidik telah menemui cara lain untuk memecahkan "dinding memori", iaitu mendekatkan pengkomputeran Memori.

Dinding memori merujuk kepada halangan fizikal yang mengehadkan kelajuan data masuk dan keluar dari memori Ini adalah had asas seni bina tradisional. Pengkomputeran dalam memori (IMC) menyelesaikan cabaran ini dengan menjalankan pengiraan matriks AI terus dalam modul memori, mengelakkan overhed penghantaran data melalui bas memori.

IMC sesuai untuk inferens AI kerana ia melibatkan set data berwajaran yang agak statik tetapi besar yang boleh diakses berulang kali. Walaupun sentiasa terdapat beberapa input dan output data, AI menghapuskan banyak perbelanjaan pemindahan tenaga dan kependaman pergerakan data dengan mengekalkan data dalam unit fizikal yang sama supaya ia boleh digunakan dengan cekap dan digunakan semula untuk berbilang pengiraan.

Pendekatan ini meningkatkan kebolehskalaan kerana ia berfungsi dengan baik dengan reka bentuk cip. Dengan cip baharu, teknologi inferens AI boleh diuji pada komputer pembangun dan kemudian digunakan ke persekitaran pengeluaran melalui pusat data. Pusat data boleh menggunakan kumpulan peralatan yang besar dengan banyak pemproses cip untuk menjalankan model AI peringkat perusahaan dengan cekap.

Dari masa ke masa, IMC dijangka menjadi seni bina dominan untuk kes penggunaan inferens AI. Ini sangat masuk akal apabila pengguna berurusan dengan set data besar-besaran dan trilion pengiraan. Kerana tiada lagi sumber terbuang untuk memindahkan data antara dinding memori, dan pendekatan ini boleh dipertingkatkan dengan mudah untuk memenuhi keperluan jangka panjang.

Ringkasan:

Industri AI kini berada di titik perubahan yang menarik. Kemajuan teknologi dalam AI generatif, pengecaman imej dan analitik data mendedahkan sambungan dan kegunaan unik untuk pembelajaran mesin, tetapi terlebih dahulu penyelesaian teknologi yang boleh memenuhi keperluan ini perlu dibina. Kerana menurut ramalan Gartner, melainkan lebih banyak pilihan yang mampan tersedia sekarang, AI akan menggunakan lebih banyak tenaga daripada aktiviti manusia menjelang 2025. Perlu memikirkan cara yang lebih baik sebelum ini berlaku!

Atas ialah kandungan terperinci Fikiran dingin di bawah kegilaan ChatGPT: Penggunaan tenaga AI pada 2025 mungkin melebihi penggunaan manusia, dan pengkomputeran AI perlu meningkatkan kualiti dan kecekapan. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan Laman Web ini
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn

Alat AI Hot

Undresser.AI Undress

Undresser.AI Undress

Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover

AI Clothes Remover

Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool

Undress AI Tool

Gambar buka pakaian secara percuma

Clothoff.io

Clothoff.io

Penyingkiran pakaian AI

AI Hentai Generator

AI Hentai Generator

Menjana ai hentai secara percuma.

Artikel Panas

R.E.P.O. Kristal tenaga dijelaskan dan apa yang mereka lakukan (kristal kuning)
3 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Tetapan grafik terbaik
3 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Cara Memperbaiki Audio Jika anda tidak dapat mendengar sesiapa
3 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌
WWE 2K25: Cara Membuka Segala -galanya Di Myrise
3 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌

Alat panas

Notepad++7.3.1

Notepad++7.3.1

Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina

SublimeText3 versi Cina

Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1

Hantar Studio 13.0.1

Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6

Dreamweaver CS6

Alat pembangunan web visual

SublimeText3 versi Mac

SublimeText3 versi Mac

Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Geospatial Laravel: Pengoptimuman peta interaktif dan sejumlah besar data Geospatial Laravel: Pengoptimuman peta interaktif dan sejumlah besar data Apr 08, 2025 pm 12:24 PM

Cecair memproses 7 juta rekod dan membuat peta interaktif dengan teknologi geospatial. Artikel ini meneroka cara memproses lebih dari 7 juta rekod menggunakan Laravel dan MySQL dan mengubahnya menjadi visualisasi peta interaktif. Keperluan Projek Cabaran Awal: Ekstrak Wawasan berharga menggunakan 7 juta rekod dalam pangkalan data MySQL. Ramai orang mula -mula mempertimbangkan bahasa pengaturcaraan, tetapi mengabaikan pangkalan data itu sendiri: Bolehkah ia memenuhi keperluan? Adakah penghijrahan data atau pelarasan struktur diperlukan? Bolehkah MySQL menahan beban data yang besar? Analisis awal: Penapis utama dan sifat perlu dikenalpasti. Selepas analisis, didapati bahawa hanya beberapa atribut yang berkaitan dengan penyelesaiannya. Kami mengesahkan kemungkinan penapis dan menetapkan beberapa sekatan untuk mengoptimumkan carian. Carian Peta Berdasarkan Bandar

Cara menyelesaikan MySQL tidak dapat dimulakan Cara menyelesaikan MySQL tidak dapat dimulakan Apr 08, 2025 pm 02:21 PM

Terdapat banyak sebab mengapa permulaan MySQL gagal, dan ia boleh didiagnosis dengan memeriksa log ralat. Penyebab umum termasuk konflik pelabuhan (periksa penghunian pelabuhan dan ubah suai konfigurasi), isu kebenaran (periksa keizinan pengguna yang menjalankan perkhidmatan), ralat fail konfigurasi (periksa tetapan parameter), rasuah direktori data (memulihkan data atau membina semula ruang meja), isu ruang jadual InnoDB (semak fail ibdata1) Apabila menyelesaikan masalah, anda harus menganalisisnya berdasarkan log ralat, cari punca utama masalah, dan mengembangkan tabiat sandaran data secara teratur untuk mencegah dan menyelesaikan masalah.

Cara Menggunakan MySQL Selepas Pemasangan Cara Menggunakan MySQL Selepas Pemasangan Apr 08, 2025 am 11:48 AM

Artikel ini memperkenalkan operasi pangkalan data MySQL. Pertama, anda perlu memasang klien MySQL, seperti MySqlworkbench atau Command Line Client. 1. Gunakan perintah MySQL-Uroot-P untuk menyambung ke pelayan dan log masuk dengan kata laluan akaun root; 2. Gunakan CreateTatabase untuk membuat pangkalan data, dan gunakan Pilih pangkalan data; 3. Gunakan createtable untuk membuat jadual, menentukan medan dan jenis data; 4. Gunakan InsertInto untuk memasukkan data, data pertanyaan, kemas kini data dengan kemas kini, dan padam data dengan padam. Hanya dengan menguasai langkah -langkah ini, belajar menangani masalah biasa dan mengoptimumkan prestasi pangkalan data anda boleh menggunakan MySQL dengan cekap.

Jurutera Backend Senior Remote (Platform) memerlukan kalangan Jurutera Backend Senior Remote (Platform) memerlukan kalangan Apr 08, 2025 pm 12:27 PM

Jurutera Backend Senior Remote Company Kekosongan Syarikat: Lokasi Lokasi: Jauh Pejabat Jauh Jenis: Gaji sepenuh masa: $ 130,000- $ 140,000 Penerangan Pekerjaan Mengambil bahagian dalam penyelidikan dan pembangunan aplikasi mudah alih Circle dan ciri-ciri berkaitan API awam yang meliputi keseluruhan kitaran hayat pembangunan perisian. Tanggungjawab utama kerja pembangunan secara bebas berdasarkan rubyonrails dan bekerjasama dengan pasukan react/redux/relay front-end. Membina fungsi teras dan penambahbaikan untuk aplikasi web dan bekerjasama rapat dengan pereka dan kepimpinan sepanjang proses reka bentuk berfungsi. Menggalakkan proses pembangunan positif dan mengutamakan kelajuan lelaran. Memerlukan lebih daripada 6 tahun backend aplikasi web kompleks

Bolehkah mysql kembali json Bolehkah mysql kembali json Apr 08, 2025 pm 03:09 PM

MySQL boleh mengembalikan data JSON. Fungsi JSON_EXTRACT mengekstrak nilai medan. Untuk pertanyaan yang kompleks, pertimbangkan untuk menggunakan klausa WHERE untuk menapis data JSON, tetapi perhatikan kesan prestasinya. Sokongan MySQL untuk JSON sentiasa meningkat, dan disyorkan untuk memberi perhatian kepada versi dan ciri terkini.

Memahami sifat asid: tiang pangkalan data yang boleh dipercayai Memahami sifat asid: tiang pangkalan data yang boleh dipercayai Apr 08, 2025 pm 06:33 PM

Penjelasan terperinci mengenai atribut asid asid pangkalan data adalah satu set peraturan untuk memastikan kebolehpercayaan dan konsistensi urus niaga pangkalan data. Mereka menentukan bagaimana sistem pangkalan data mengendalikan urus niaga, dan memastikan integriti dan ketepatan data walaupun dalam hal kemalangan sistem, gangguan kuasa, atau pelbagai pengguna akses serentak. Gambaran keseluruhan atribut asid Atomicity: Transaksi dianggap sebagai unit yang tidak dapat dipisahkan. Mana -mana bahagian gagal, keseluruhan transaksi dilancarkan kembali, dan pangkalan data tidak mengekalkan sebarang perubahan. Sebagai contoh, jika pemindahan bank ditolak dari satu akaun tetapi tidak meningkat kepada yang lain, keseluruhan operasi dibatalkan. Begintransaction; UpdateAcCountSsetBalance = Balance-100Wh

Kunci utama MySQL boleh menjadi batal Kunci utama MySQL boleh menjadi batal Apr 08, 2025 pm 03:03 PM

Kunci utama MySQL tidak boleh kosong kerana kunci utama adalah atribut utama yang secara unik mengenal pasti setiap baris dalam pangkalan data. Jika kunci utama boleh kosong, rekod tidak dapat dikenal pasti secara unik, yang akan membawa kepada kekeliruan data. Apabila menggunakan lajur integer sendiri atau UUIDs sebagai kunci utama, anda harus mempertimbangkan faktor-faktor seperti kecekapan dan penghunian ruang dan memilih penyelesaian yang sesuai.

Klausa had SQL Master: Kawal bilangan baris dalam pertanyaan Klausa had SQL Master: Kawal bilangan baris dalam pertanyaan Apr 08, 2025 pm 07:00 PM

Klausa SQLLIMIT: Kawal bilangan baris dalam hasil pertanyaan. Klausa had dalam SQL digunakan untuk mengehadkan bilangan baris yang dikembalikan oleh pertanyaan. Ini sangat berguna apabila memproses set data yang besar, paparan paginat dan data ujian, dan dapat meningkatkan kecekapan pertanyaan dengan berkesan. Sintaks Asas Sintaks: SelectColumn1, Column2, ... FROMTABLE_NAMELIMITNUMBER_OF_ROWS; Number_of_rows: Tentukan bilangan baris yang dikembalikan. Sintaks dengan Offset: SelectColumn1, Column2, ... Fromtable_namelimitoffset, Number_of_rows; Offset: Langkau

See all articles