Kos dan kemampanan AI generatif
Semua orang yang menggunakan DALL-E untuk mencipta imej atau membiarkan ChatGPT menulis kertas penggal memerlukan banyak sumber awan. Siapa yang akan membayar untuk semua ini?
Penterjemah |. Bugatti
Penilai |. Sun Shujuan
Kecerdasan buatan (AI) ialah teknologi intensif sumber untuk mana-mana platform (termasuk awan awam) . Kebanyakan teknologi AI memerlukan sejumlah besar pengiraan inferens, dengan itu meningkatkan permintaan untuk pemproses, rangkaian dan sumber storan, akhirnya meningkatkan bil elektrik, kos infrastruktur dan pelepasan karbon.
Kebangkitan sistem AI generatif seperti ChatGPT sekali lagi membawa isu ini ke hadapan. Memandangkan populariti teknologi ini dan kemungkinan penggunaannya secara meluas oleh syarikat, kerajaan dan orang awam, kita boleh menjangkakan lengkungan pertumbuhan penggunaan kuasa yang membimbangkan.
AI boleh dilaksanakan sejak tahun 1970-an, tetapi pada mulanya tidak mempunyai banyak kesan komersial, memandangkan sistem AI yang matang dan lengkap memerlukan banyak sumber untuk berfungsi dengan baik. Saya masih ingat sistem berasaskan AI yang saya reka pada usia 20-an yang memerlukan lebih $40 juta dalam perkakasan, perisian dan ruang pusat data untuk menjalankannya. Secara kebetulan, projek ini, seperti banyak projek AI lain, tidak pernah melihat tarikh keluaran, dan penyelesaian komersil itu tidak berdaya maju.
Pengkomputeran awan mengubah segala-galanya. Dengan awan awam, tugasan yang dahulunya di luar jangkauan kini boleh dikendalikan dengan keberkesanan kos yang cukup ketara. Sebenarnya, seperti yang anda duga, peningkatan pengkomputeran awan bertepatan dengan peningkatan AI dalam tempoh 10 hingga 15 tahun yang lalu, dan saya akan mengatakan kedua-duanya kini berkait rapat.
Kemampanan dan Kos Sumber Awan
Ia tidak memerlukan banyak penyelidikan untuk meramalkan perkara yang akan berlaku di kawasan ini. Permintaan pasaran untuk perkhidmatan AI akan melonjak, seperti sistem AI generatif yang kini sangat popular dan sistem AI dan pembelajaran mesin yang lain. Mengetuai pertuduhan ialah syarikat yang mencari kelebihan melalui inovasi, seperti rantaian bekalan pintar, atau bahkan ribuan pelajar kolej yang mencari sistem AI generatif untuk menulis kertas penggal mereka.
Permintaan yang meningkat untuk AI bermakna peningkatan permintaan untuk sumber yang digunakan oleh sistem AI ini, seperti awan awam dan perkhidmatan yang mereka sediakan. Permintaan ini mungkin akan dipenuhi oleh lebih banyak pusat data yang menempatkan pelayan yang haus kuasa dan peralatan rangkaian.
Penyedia awan awam, seperti mana-mana penyedia sumber utiliti lain, akan menaikkan harga apabila permintaan meningkat, sama seperti kita melihat kenaikan bermusim dalam bil elektrik kediaman (sekali lagi berdasarkan permintaan). Oleh itu, kami biasanya mengawal penggunaan elektrik dan menaikkan suhu penghawa dingin lebih tinggi pada musim panas.
Walau bagaimanapun, kos pengkomputeran awan yang lebih tinggi mungkin tidak mempunyai kesan yang sama pada perniagaan. Perusahaan mungkin mendapati bahawa sistem AI ini tidak boleh diketepikan, tetapi perlu untuk memacu proses perniagaan utama tertentu. Dalam kebanyakan kes, mereka mungkin cuba menjimatkan wang secara dalaman, mungkin dengan mengurangkan jumlah pekerja untuk mengimbangi kos sistem AI. Bukan rahsia lagi bahawa sistem AI generatif akan menggantikan ramai pekerja maklumat tidak lama lagi.
Apa yang boleh kita lakukan?
Jika permintaan sumber untuk menjalankan sistem AI mengakibatkan kos pengkomputeran dan pelepasan karbon yang lebih tinggi, apakah yang boleh kita lakukan mengenainya? Jawapannya mungkin terletak pada mencari cara yang lebih cekap untuk AI menggunakan sepenuhnya sumber seperti pemproses, rangkaian dan storan.
Sebagai contoh, pensampelan saluran paip boleh mempercepatkan pembelajaran mendalam dengan mengurangkan jumlah data yang diproses. Penyelidikan daripada Institut Teknologi Massachusetts (MIT) dan IBM menunjukkan bahawa menggunakan pendekatan ini boleh mengurangkan sumber yang diperlukan untuk menjalankan rangkaian saraf pada set data yang besar. Walau bagaimanapun, ini juga mengehadkan ketepatan, yang boleh diterima untuk sesetengah kes penggunaan perniagaan tetapi tidak untuk semua.
Satu lagi pendekatan yang telah digunakan dalam bidang teknologi lain ialah pengkomputeran dalam memori. Seni bina ini boleh mempercepatkan pemprosesan AI dengan mengelakkan data bergerak masuk dan keluar dari memori. Sebaliknya, pengiraan AI berjalan terus dalam modul memori, yang mempercepatkan perkara dengan ketara.
Pendekatan lain sedang dibangunkan, seperti menukar pemproses fizikal (menggunakan pemproses bersama untuk mengendalikan pengiraan AI untuk meningkatkan kelajuan) atau mengguna pakai model pengkomputeran generasi seterusnya seperti pengkomputeran kuantum. Anda boleh mengharapkan penyedia awan awam yang besar untuk mengumumkan teknologi yang menangani banyak isu ini dalam masa terdekat.
Apa yang perlu anda lakukan?
Artikel ini bukan tentang mengelakkan AI untuk mengurangkan kos pengkomputeran awan atau menyelamatkan planet ini. AI ialah kaedah pengkomputeran asas yang boleh digunakan oleh kebanyakan perniagaan untuk mencipta nilai yang luar biasa.
Adalah disyorkan bahawa apabila menjalankan projek pembangunan berasaskan AI atau projek pembangunan sistem AI baharu, anda harus memahami dengan jelas kesan ke atas kos dan kemampanan, kerana kedua-duanya berkait rapat. Anda perlu membuat pilihan kos/faedah, yang benar-benar kembali kepada topik lama tentang nilai yang boleh anda bawa kepada syarikat untuk kos dan risiko yang perlu anda ambil. Tiada yang baru di sini.
Saya percaya bahawa masalah ini sebahagian besarnya dijangka dapat diselesaikan melalui inovasi, sama ada inovasi itu ialah pengkomputeran dalam ingatan, pengkomputeran kuantum atau teknologi lain yang masih belum muncul. Pembekal teknologi AI dan penyedia pengkomputeran awan berminat untuk menjadikan AI lebih kos efektif, cekap tenaga dan mesra alam, yang merupakan berita baik.
Tajuk asal: Kos dan kemampanan AI generatif, pengarang: David S. Linthicum
Atas ialah kandungan terperinci Kos dan kemampanan AI generatif. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Alat AI Hot

Undresser.AI Undress
Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover
Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool
Gambar buka pakaian secara percuma

Clothoff.io
Penyingkiran pakaian AI

AI Hentai Generator
Menjana ai hentai secara percuma.

Artikel Panas

Alat panas

Notepad++7.3.1
Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina
Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1
Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6
Alat pembangunan web visual

SublimeText3 versi Mac
Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Topik panas



DALL-E 3 telah diperkenalkan secara rasmi pada September 2023 sebagai model yang jauh lebih baik daripada pendahulunya. Ia dianggap sebagai salah satu penjana imej AI terbaik setakat ini, mampu mencipta imej dengan perincian yang rumit. Walau bagaimanapun, semasa pelancaran, ia adalah tidak termasuk

Laman web ini melaporkan pada 27 Jun bahawa Jianying ialah perisian penyuntingan video yang dibangunkan oleh FaceMeng Technology, anak syarikat ByteDance Ia bergantung pada platform Douyin dan pada asasnya menghasilkan kandungan video pendek untuk pengguna platform tersebut Windows , MacOS dan sistem pengendalian lain. Jianying secara rasmi mengumumkan peningkatan sistem keahliannya dan melancarkan SVIP baharu, yang merangkumi pelbagai teknologi hitam AI, seperti terjemahan pintar, penonjolan pintar, pembungkusan pintar, sintesis manusia digital, dsb. Dari segi harga, yuran bulanan untuk keratan SVIP ialah 79 yuan, yuran tahunan ialah 599 yuan (nota di laman web ini: bersamaan dengan 49.9 yuan sebulan), langganan bulanan berterusan ialah 59 yuan sebulan, dan langganan tahunan berterusan ialah 499 yuan setahun (bersamaan dengan 41.6 yuan sebulan) . Di samping itu, pegawai yang dipotong juga menyatakan bahawa untuk meningkatkan pengalaman pengguna, mereka yang telah melanggan VIP asal

Model Bahasa Besar (LLM) dilatih pada pangkalan data teks yang besar, di mana mereka memperoleh sejumlah besar pengetahuan dunia sebenar. Pengetahuan ini dibenamkan ke dalam parameter mereka dan kemudiannya boleh digunakan apabila diperlukan. Pengetahuan tentang model ini "diperbaharui" pada akhir latihan. Pada akhir pra-latihan, model sebenarnya berhenti belajar. Selaraskan atau perhalusi model untuk mempelajari cara memanfaatkan pengetahuan ini dan bertindak balas dengan lebih semula jadi kepada soalan pengguna. Tetapi kadangkala pengetahuan model tidak mencukupi, dan walaupun model boleh mengakses kandungan luaran melalui RAG, ia dianggap berfaedah untuk menyesuaikan model kepada domain baharu melalui penalaan halus. Penalaan halus ini dilakukan menggunakan input daripada anotasi manusia atau ciptaan LLM lain, di mana model menemui pengetahuan dunia sebenar tambahan dan menyepadukannya

Menurut berita dari laman web ini pada 31 Julai, gergasi teknologi Amazon menyaman syarikat telekomunikasi Finland Nokia di mahkamah persekutuan Delaware pada hari Selasa, menuduhnya melanggar lebih daripada sedozen paten Amazon yang berkaitan dengan teknologi pengkomputeran awan. 1. Amazon menyatakan dalam tuntutan mahkamah bahawa Nokia menyalahgunakan teknologi berkaitan Perkhidmatan Pengkomputeran Awan Amazon (AWS), termasuk infrastruktur pengkomputeran awan, keselamatan dan teknologi prestasi, untuk meningkatkan produk perkhidmatan awannya sendiri. Amazon melancarkan AWS pada 2006 dan teknologi pengkomputeran awan terobosannya telah dibangunkan sejak awal 2000-an, kata aduan itu. "Amazon adalah perintis dalam pengkomputeran awan, dan kini Nokia menggunakan inovasi pengkomputeran awan yang dipatenkan Amazon tanpa kebenaran," bunyi aduan itu. Amazon meminta mahkamah untuk injunksi untuk menyekat

Editor |ScienceAI Question Answering (QA) set data memainkan peranan penting dalam mempromosikan penyelidikan pemprosesan bahasa semula jadi (NLP). Set data QA berkualiti tinggi bukan sahaja boleh digunakan untuk memperhalusi model, tetapi juga menilai dengan berkesan keupayaan model bahasa besar (LLM), terutamanya keupayaan untuk memahami dan menaakul tentang pengetahuan saintifik. Walaupun pada masa ini terdapat banyak set data QA saintifik yang meliputi bidang perubatan, kimia, biologi dan bidang lain, set data ini masih mempunyai beberapa kekurangan. Pertama, borang data adalah agak mudah, kebanyakannya adalah soalan aneka pilihan. Ia mudah dinilai, tetapi mengehadkan julat pemilihan jawapan model dan tidak dapat menguji sepenuhnya keupayaan model untuk menjawab soalan saintifik. Sebaliknya, Soal Jawab terbuka

Editor |. KX Dalam bidang penyelidikan dan pembangunan ubat, meramalkan pertalian pengikatan protein dan ligan dengan tepat dan berkesan adalah penting untuk pemeriksaan dan pengoptimuman ubat. Walau bagaimanapun, kajian semasa tidak mengambil kira peranan penting maklumat permukaan molekul dalam interaksi protein-ligan. Berdasarkan ini, penyelidik dari Universiti Xiamen mencadangkan rangka kerja pengekstrakan ciri berbilang mod (MFE) novel, yang buat pertama kalinya menggabungkan maklumat mengenai permukaan protein, struktur dan jujukan 3D, dan menggunakan mekanisme perhatian silang untuk membandingkan ciri modaliti yang berbeza penjajaran. Keputusan eksperimen menunjukkan bahawa kaedah ini mencapai prestasi terkini dalam meramalkan pertalian mengikat protein-ligan. Tambahan pula, kajian ablasi menunjukkan keberkesanan dan keperluan maklumat permukaan protein dan penjajaran ciri multimodal dalam rangka kerja ini. Penyelidikan berkaitan bermula dengan "S

Menurut berita dari laman web ini pada 5 Julai, GlobalFoundries mengeluarkan kenyataan akhbar pada 1 Julai tahun ini, mengumumkan pemerolehan teknologi power gallium nitride (GaN) Tagore Technology dan portfolio harta intelek, dengan harapan dapat mengembangkan bahagian pasarannya dalam kereta dan Internet of Things dan kawasan aplikasi pusat data kecerdasan buatan untuk meneroka kecekapan yang lebih tinggi dan prestasi yang lebih baik. Memandangkan teknologi seperti AI generatif terus berkembang dalam dunia digital, galium nitrida (GaN) telah menjadi penyelesaian utama untuk pengurusan kuasa yang mampan dan cekap, terutamanya dalam pusat data. Laman web ini memetik pengumuman rasmi bahawa semasa pengambilalihan ini, pasukan kejuruteraan Tagore Technology akan menyertai GLOBALFOUNDRIES untuk membangunkan lagi teknologi gallium nitride. G

Menurut berita dari laman web ini pada 1 Ogos, SK Hynix mengeluarkan catatan blog hari ini (1 Ogos), mengumumkan bahawa ia akan menghadiri Global Semiconductor Memory Summit FMS2024 yang akan diadakan di Santa Clara, California, Amerika Syarikat dari 6 hingga 8 Ogos, mempamerkan banyak produk penjanaan teknologi baru. Pengenalan kepada Sidang Kemuncak Memori dan Penyimpanan Masa Depan (FutureMemoryandStorage), dahulunya Sidang Kemuncak Memori Flash (FlashMemorySummit) terutamanya untuk pembekal NAND, dalam konteks peningkatan perhatian kepada teknologi kecerdasan buatan, tahun ini dinamakan semula sebagai Sidang Kemuncak Memori dan Penyimpanan Masa Depan (FutureMemoryandStorage) kepada jemput vendor DRAM dan storan serta ramai lagi pemain. Produk baharu SK hynix dilancarkan tahun lepas
