Jika anda sedang mencari topik yang menarik, Kepintaran Buatan (AI) tidak akan mengecewakan anda. Kecerdasan buatan merangkumi satu set algoritma statistik yang kuat dan membengkokkan minda yang boleh bermain catur, mentafsir tulisan tangan yang ceroboh, memahami pertuturan, mengklasifikasikan imej satelit dan banyak lagi. Ketersediaan set data gergasi untuk melatih model pembelajaran mesin telah menjadi salah satu faktor utama dalam kejayaan kecerdasan buatan. Tetapi semua kerja pengiraan ini tidak percuma. Sesetengah pakar AI semakin bimbang tentang kesan alam sekitar yang dikaitkan dengan membina algoritma baharu, perdebatan yang telah mendorong idea baharu tentang cara membuat mesin belajar dengan lebih cekap untuk mengurangkan jejak karbon AI.
Untuk mendapatkan butirannya, pertama sekali kita perlu mempertimbangkan beribu-ribu pusat data (seluruh dunia) yang beroperasi 24/ 7 Kendalikan permintaan pengiraan kami. Bagi penyelidik AI, tugas ini termasuk melatih algoritma berbilang lapisan dengan berbilion elemen data (atau token—bit perkataan bersamaan dengan empat aksara atau kira-kira 3/4 perkataan dalam bahasa Inggeris). Usaha pengiraan yang terlibat adalah menakjubkan. Syarikat infrastruktur kecerdasan buatan Lambda menyediakan beberapa fakta menarik tentang GPT-3, model bahasa semula jadi OpenAI yang berkuasa untuk menjana teks seperti manusia. Menurut analisis Lambda, jika anda ingin melatih model parameter 175 bilion GPT-3 pada NVIDIA RTX 8000 tunggal, ia akan mengambil masa 665 tahun, yang mana ianya tidak mudah untuk digunakan dalam kad grafik.
Ringkasnya, lebih besar model, lebih baik prestasi pasukan Lambda menunjukkan bahawa saiz model bahasa terkini berkembang pada kadar 10 kali setiap tahun, yang membawa kita. kembali kepada pemahaman AI yang semakin meningkat tentang jejak karbon. Kembali ke pusat data, anda boleh menambah lebih banyak nombor pada perbincangan, sekurang-kurangnya pada tahap yang tinggi. Menurut anggaran Agensi Tenaga Antarabangsa (IEA), jumlah penggunaan elektrik pusat data di seluruh dunia adalah antara 200 dan 250 TWj. Untuk menjadikan nombor ini lebih mudah untuk digambarkan, dengan mengandaikan bahawa lokomotif dan kereta luncur menggunakan purata 2.5 kilowatt jam setiap kilometer perjalanan, 225 jam terawatt sudah cukup untuk membolehkan kereta api elektrik berkelajuan tinggi bergerak sejauh 9 juta kilometer. Walaupun hanya sebahagian (dalam pusat data) akan digunakan untuk melatih dan menjalankan model AI, sumber menunjukkan bahawa permintaan pengkomputeran untuk pembelajaran mesin dan latihan mengatasi pertumbuhan purata dalam aktiviti pusat data.
Pada ketika ini adalah adil untuk mengakui bahawa pusat data menjalankan tugas dengan baik dalam mengurus keperluan tenaga mereka – kebimbangan alam sekitar adalah pendorong, tetapi perlu dinyatakan bahawa kuasa adalah perbelanjaan operasi yang ketara, "Misi kritikal" kepada setiap Walaupun terdapat lonjakan dalam trafik internet global, meningkat 40% pada tahun 2020 sahaja, penggunaan tenaga pusat data kekal stabil sepanjang dekad yang lalu. "Pertumbuhan kukuh dalam permintaan untuk perkhidmatan pusat data terus diimbangi oleh peningkatan kecekapan berterusan dalam pelayan, storan, suis rangkaian dan infrastruktur pusat data, serta bahagian perkhidmatan yang semakin meningkat yang disediakan oleh pusat data awan dan hiperskala yang cekap," IEA menulis.
Selain itu, pengendali pusat data bersepadu secara menegak seperti Amazon, Google, Facebook dan lain-lain akan menambah bahawa kemudahan mereka dikuasakan oleh tenaga boleh diperbaharui. Sememangnya, ini mengurangkan beban alam sekitar pemprosesan data, kerana tenaga elektrik kepada rak kuasa perkakasan pengkomputeran dan perkhidmatan sampingan yang diperlukan seperti pemanasan, penyejukan dan pencahayaan boleh datang dari matahari dan angin. Walau bagaimanapun, memandangkan Financial Times tidak memilih, walaupun perjanjian tenaga pusat data boleh mengimbangi 100% penggunaan elektriknya melalui tenaga boleh diperbaharui, kemudahan itu mungkin masih menggunakan bahan api fosil apabila angin dan solar tidak tersedia. Terdapat juga keperluan untuk mempertimbangkan pelepasan karbon terbenam peranti pengkomputeran itu sendiri, kerana kaedah pembuatan dan aktiviti penyumberan bahan komponen juga menghasilkan pelepasan karbon - sesuatu yang diakui oleh Microsoft.
Awal tahun ini, Microsoft membincangkan topik latihan model yang cekap dalam catatan blog baru-baru ini. Pembangun sibuk meneroka cara untuk mengecilkan jejak karbon AI—atau sekurang-kurangnya mengekang pertumbuhannya. Langkah di sini termasuk mencari cara untuk mengurangkan keperluan pengiraan dan memori semasa penalaan halus model, dengan pengesyoran mengesyorkan pengurangan tiga kali ganda dalam penggunaan GPU semasa peringkat proses ini. Pemampatan model juga menunjukkan janji, di mana sub-lapisan data AI dipangkas menjadi versi yang lebih jarang tetapi masih mewakili keadaan gabungan sebelumnya. Di sini, penyelidikan menunjukkan bahawa model memampatkan mungkin memerlukan masa latihan lebih kurang 40% sambil mencapai hasil algoritma yang serupa.
Pembangun juga boleh mendapat manfaat daripada alat pemantauan yang akan menentukan keuntungan yang diperoleh dengan mengoptimumkan pengaturan pengehosan kod atau data. "CodeCarbon ialah pakej perisian ringan yang disepadukan dengan lancar ke dalam pangkalan kod Python anda," tulis pencipta, yang menyediakan alat mereka secara percuma. "Ia menganggarkan jumlah karbon dioksida (CO2) yang dihasilkan oleh awan atau sumber pengkomputeran peribadi yang digunakan untuk melaksanakan kod."
Kitaran ini berulang-alik, dengan AI yang lebih cekap tenaga mungkin akan digunakan pada masa hadapan untuk membantu membimbing operasi pusat data yang lebih cekap untuk mengurangkan – anda rasa itu – jejak karbon AI . Hari ini, Cirrus Nexus menyediakan perisian tersedia yang boleh digunakan oleh pengendali pusat data untuk memperuntukkan kos kepada karbon dan menyebarkannya melalui algoritma kecerdasan buatan. Hasilnya bukan sahaja menunjukkan pengiraan CO2, tetapi juga memberikan pandangan tentang cara pengguna boleh mengkonfigurasi kemudahan mereka untuk memaksimumkan faedah alam sekitar yang tersedia.
Menjadikan jejak karbon bagi algoritma yang menjanakan teknologi hari ini kelihatan membantu dalam pelbagai cara. Ia membuka perbincangan tentang cara paling berkesan untuk melatih kecerdasan buatan masa depan, menjadikan jabatan IT dan pelanggan mereka lebih bertanggungjawab terhadap kos persekitaran pengkomputeran. Akhirnya, ia boleh menjadi baik untuk perniagaan. Terutama, Amazon mengeluarkan alat jejak karbon pelanggan awal tahun ini, dan syarikat utama lain seperti Google membenarkan pelanggan mengeksport maklumat pelepasan karbon awan - perkhidmatan yang sedang dalam pratonton.
Atas ialah kandungan terperinci Mengira kos karbon bagi kecerdasan buatan. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!