ChatGPT mempunyai impak dwi terhadap kuasa pengkomputeran
ChatGPT telah menjadi topik hangat sejak beberapa bulan kebelakangan ini. Sebab di sebalik popularitinya yang berterusan adalah peningkatan permintaan untuk kuasa pengkomputeran kandungan kecerdasan buatan teknologi penjanaan automatik. Di satu pihak, ChatGPT telah memacu pertumbuhan permintaan untuk kuasa pengkomputeran Sebaliknya, ChatGPT telah mengemukakan keperluan yang lebih tinggi untuk sokongan kuasa pengkomputeran.
Data menunjukkan bahawa jumlah penggunaan kuasa pengkomputeran yang diperlukan untuk latihan model ChatGPT ialah 3640PF-hari, menelan belanja kira-kira 12 juta dolar AS, dan juga memerlukan overhed yang besar dalam proses operasi . Menurut laporan Guosheng Securities, berdasarkan purata bilangan pelawat unik ke ChatGPT pada bulan Januari sebanyak 13 juta, permintaan cip sepadan adalah lebih daripada 30,000 GPU Nvidia A100, anggaran kos kuasa pengkomputeran ialah 800 juta dolar AS, dan elektrik harian kos ialah 50,000 dolar AS Sekitar USD. ChatGPT telah menerima pelaburan AS$13 bilion daripada Microsoft, yang merupakan sokongan keyakinan di sebalik pelaburan kuasa pengkomputeran tingginya. Justru dengan sokongan penuh gergasi teknologi Microsoft daripada dana, pasaran masa hadapan, kepada infrastruktur pengkomputeran (Azure cloud) OpenAI boleh menyiapkan projek yang begitu besar sebagai perusahaan keusahawanan bebas. Keperluan kuasa pengkomputeran berkait rapat dengan magnitud parameter juga merupakan rujukan penting untuk mengukur kualiti latihan model besar. Lebih besar bilangan parameter, lebih pintar model, dan lebih besar overhed yang disertakan dengannya. Ini membentuk ciri ambang tinggi untuk jenis GPT. Versi sebelumnya GPT-3 adalah sumber terbuka, memudahkan usahawan lain untuk menjalankan kerja penyelidikan dan pembangunan baharu berdasarkannya. Bermula dari GPT-4, OpenAI membuka caj API berdasarkan trafik bait. Sama ada pembangunan aplikasi atau pembangunan model sekunder berdasarkan ini, terdapat ambang yang tinggi.
Perkara yang lebih menarik ialah kebocoran kod sumber LLaMA syarikat Meta. Akibatnya, model besar yang dipanggil "Keluarga Llama" ("Llama" boleh diterjemahkan sebagai "Alpaca") Pembangun yang ingin mendapatkan sumber sumber terbuka boleh mendapatkan pilihan baharu selain GPT-3.
Pergantungan tinggi "model besar" pada kuasa pengkomputeran mempunyai sekurang-kurangnya dua kesan utama.
Pertama, ini bukan lagi permainan keusahawanan "akar umbi", dan juga bukan permainan keusahawanan Internet "Copy To China" pada masa lalu, tetapi pertandingan kecekapan teras "pedang dan senjata sebenar", daripada modal, teknologi kepada penilaian Komprehensif penentuan strategik korporat. Dalam era perindustrian tradisional, China bermula dari industri pemprosesan dan secara beransur-ansur beralih kepada penyelidikan dan pembangunan teknologi teras bernilai tinggi Namun, sebenarnya, ia masih jauh dari tahap paling maju di Eropah dan Amerika Syarikat. Terutama dalam kategori seperti sains bahan yang memerlukan pengumpulan teknikal jangka panjang, jurang masih besar.
Dalam era digital, konsensus dalam kalangan industri China telah menjadi untuk bermula secara langsung dengan penyelidikan dan pembangunan teknologi teras.
Telah menjadi trend bagi Amerika Syarikat dan China untuk menjadi kurang bergantung antara satu sama lain dalam sains dan teknologi. Walaupun hanya industri cip yang dikekang sekarang, jika "model besar" berkembang menjadi faktor pengeluaran, kita pasti akan menghadapi masalah yang sama. Oleh itu, China mesti mempunyai teknologi teras "model besar" sendiri. Melihat perkara yang tidak dapat dielakkan ini, syarikat teknologi China juga telah menjadi trend untuk melabur banyak dalam "model besar".
Jika syarikat teknologi bersaiz kecil dan sederhana tidak mempunyai keupayaan untuk membangunkan "model besar" asli, mereka boleh menggunakan model sumber terbuka GPT-3 atau LLaMA untuk pembangunan atau pembangunan sekunder untuk membentuk mereka sendiri " model besar". Syarikat pembangunan aplikasi jarang membangunkan "model besar" asli Melainkan mereka mempunyai keyakinan yang sangat tinggi dalam pasaran jualan aplikasi mereka, mereka akan tunduk kepada tekanan kos kuasa pengkomputeran yang besar dan sebaliknya membayar yuran penggunaan API untuk membangunkan aplikasi berkaitan menggunakan model sedia. .
Kedua, pembinaan "Timur dan Barat" tepat pada masanya dan mungkin membuka peluang perniagaan yang besar.
Wilayah barat kaya dengan sumber "kuasa hijau" Di bawah rancangan keseluruhan "Eastern Digital and Western Computing", hab barat bertanggungjawab terutamanya untuk sandaran dan penyimpanan; pengkomputeran masa di bandar pintar, Internet industri dan perkhidmatan Internet Kerja akan diselesaikan di hab di wilayah timur. "Model besar" mempunyai keperluan besar untuk kuasa pengkomputeran Timur IDC menduduki sumber kuasa pengkomputeran secara besar-besaran, yang mempunyai tiga kelemahan utama: kos tinggi (bil elektrik tinggi di timur), pelepasan tinggi (perkadaran tenaga elektrik hijau di kawasan itu. timur kecil), dan menyesakkan kuasa pengkomputeran untuk aplikasi dengan keperluan kependaman rendah, yang mewujudkan peluang perniagaan baharu untuk pusat kuasa pengkomputeran di barat.
Di satu pihak, meletakkan pengiraan latihan "model besar" di IDC di wilayah barat mempunyai keperluan yang lebih tinggi untuk peningkatan prestasi rangkaian komunikasi tempatan. Keupayaan data besar-besaran adalah masalah yang perlu diselesaikan, tetapi kos untuk menyelesaikan masalah ini jauh lebih rendah daripada perbezaan dalam yuran penggunaan IDC.
Sebaliknya, syarikat gergasi teknologi telah mengemukakan matlamat ESG (tanggungjawab sosial alam sekitar) mereka sendiri, dan pelepasan karbon adalah penunjuk yang paling penting. Operasi "model besar" dan kuasa pengkomputeran yang besar akan menghasilkan sejumlah besar pelepasan karbon, dan permintaan untuk "kuasa pengkomputeran hijau" akan menjadi lebih mendesak.
Atas ialah kandungan terperinci ChatGPT mempunyai impak dwi terhadap kuasa pengkomputeran. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Alat AI Hot

Undresser.AI Undress
Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover
Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool
Gambar buka pakaian secara percuma

Clothoff.io
Penyingkiran pakaian AI

AI Hentai Generator
Menjana ai hentai secara percuma.

Artikel Panas

Alat panas

Notepad++7.3.1
Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina
Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1
Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6
Alat pembangunan web visual

SublimeText3 versi Mac
Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Topik panas



DALL-E 3 telah diperkenalkan secara rasmi pada September 2023 sebagai model yang jauh lebih baik daripada pendahulunya. Ia dianggap sebagai salah satu penjana imej AI terbaik setakat ini, mampu mencipta imej dengan perincian yang rumit. Walau bagaimanapun, semasa pelancaran, ia adalah tidak termasuk

Laman web ini melaporkan pada 27 Jun bahawa Jianying ialah perisian penyuntingan video yang dibangunkan oleh FaceMeng Technology, anak syarikat ByteDance Ia bergantung pada platform Douyin dan pada asasnya menghasilkan kandungan video pendek untuk pengguna platform tersebut Windows , MacOS dan sistem pengendalian lain. Jianying secara rasmi mengumumkan peningkatan sistem keahliannya dan melancarkan SVIP baharu, yang merangkumi pelbagai teknologi hitam AI, seperti terjemahan pintar, penonjolan pintar, pembungkusan pintar, sintesis manusia digital, dsb. Dari segi harga, yuran bulanan untuk keratan SVIP ialah 79 yuan, yuran tahunan ialah 599 yuan (nota di laman web ini: bersamaan dengan 49.9 yuan sebulan), langganan bulanan berterusan ialah 59 yuan sebulan, dan langganan tahunan berterusan ialah 499 yuan setahun (bersamaan dengan 41.6 yuan sebulan) . Di samping itu, pegawai yang dipotong juga menyatakan bahawa untuk meningkatkan pengalaman pengguna, mereka yang telah melanggan VIP asal

Tingkatkan produktiviti, kecekapan dan ketepatan pembangun dengan menggabungkan penjanaan dipertingkatkan semula dan memori semantik ke dalam pembantu pengekodan AI. Diterjemah daripada EnhancingAICodingAssistantswithContextUsingRAGandSEM-RAG, pengarang JanakiramMSV. Walaupun pembantu pengaturcaraan AI asas secara semulajadi membantu, mereka sering gagal memberikan cadangan kod yang paling relevan dan betul kerana mereka bergantung pada pemahaman umum bahasa perisian dan corak penulisan perisian yang paling biasa. Kod yang dijana oleh pembantu pengekodan ini sesuai untuk menyelesaikan masalah yang mereka bertanggungjawab untuk menyelesaikannya, tetapi selalunya tidak mematuhi piawaian pengekodan, konvensyen dan gaya pasukan individu. Ini selalunya menghasilkan cadangan yang perlu diubah suai atau diperhalusi agar kod itu diterima ke dalam aplikasi

Model Bahasa Besar (LLM) dilatih pada pangkalan data teks yang besar, di mana mereka memperoleh sejumlah besar pengetahuan dunia sebenar. Pengetahuan ini dibenamkan ke dalam parameter mereka dan kemudiannya boleh digunakan apabila diperlukan. Pengetahuan tentang model ini "diperbaharui" pada akhir latihan. Pada akhir pra-latihan, model sebenarnya berhenti belajar. Selaraskan atau perhalusi model untuk mempelajari cara memanfaatkan pengetahuan ini dan bertindak balas dengan lebih semula jadi kepada soalan pengguna. Tetapi kadangkala pengetahuan model tidak mencukupi, dan walaupun model boleh mengakses kandungan luaran melalui RAG, ia dianggap berfaedah untuk menyesuaikan model kepada domain baharu melalui penalaan halus. Penalaan halus ini dilakukan menggunakan input daripada anotasi manusia atau ciptaan LLM lain, di mana model menemui pengetahuan dunia sebenar tambahan dan menyepadukannya

Editor |ScienceAI Question Answering (QA) set data memainkan peranan penting dalam mempromosikan penyelidikan pemprosesan bahasa semula jadi (NLP). Set data QA berkualiti tinggi bukan sahaja boleh digunakan untuk memperhalusi model, tetapi juga menilai dengan berkesan keupayaan model bahasa besar (LLM), terutamanya keupayaan untuk memahami dan menaakul tentang pengetahuan saintifik. Walaupun pada masa ini terdapat banyak set data QA saintifik yang meliputi bidang perubatan, kimia, biologi dan bidang lain, set data ini masih mempunyai beberapa kekurangan. Pertama, borang data adalah agak mudah, kebanyakannya adalah soalan aneka pilihan. Ia mudah dinilai, tetapi mengehadkan julat pemilihan jawapan model dan tidak dapat menguji sepenuhnya keupayaan model untuk menjawab soalan saintifik. Sebaliknya, Soal Jawab terbuka

Editor |. KX Dalam bidang penyelidikan dan pembangunan ubat, meramalkan pertalian pengikatan protein dan ligan dengan tepat dan berkesan adalah penting untuk pemeriksaan dan pengoptimuman ubat. Walau bagaimanapun, kajian semasa tidak mengambil kira peranan penting maklumat permukaan molekul dalam interaksi protein-ligan. Berdasarkan ini, penyelidik dari Universiti Xiamen mencadangkan rangka kerja pengekstrakan ciri berbilang mod (MFE) novel, yang buat pertama kalinya menggabungkan maklumat mengenai permukaan protein, struktur dan jujukan 3D, dan menggunakan mekanisme perhatian silang untuk membandingkan ciri modaliti yang berbeza penjajaran. Keputusan eksperimen menunjukkan bahawa kaedah ini mencapai prestasi terkini dalam meramalkan pertalian mengikat protein-ligan. Tambahan pula, kajian ablasi menunjukkan keberkesanan dan keperluan maklumat permukaan protein dan penjajaran ciri multimodal dalam rangka kerja ini. Penyelidikan berkaitan bermula dengan "S

Menurut berita dari laman web ini pada 5 Julai, GlobalFoundries mengeluarkan kenyataan akhbar pada 1 Julai tahun ini, mengumumkan pemerolehan teknologi power gallium nitride (GaN) Tagore Technology dan portfolio harta intelek, dengan harapan dapat mengembangkan bahagian pasarannya dalam kereta dan Internet of Things dan kawasan aplikasi pusat data kecerdasan buatan untuk meneroka kecekapan yang lebih tinggi dan prestasi yang lebih baik. Memandangkan teknologi seperti AI generatif terus berkembang dalam dunia digital, galium nitrida (GaN) telah menjadi penyelesaian utama untuk pengurusan kuasa yang mampan dan cekap, terutamanya dalam pusat data. Laman web ini memetik pengumuman rasmi bahawa semasa pengambilalihan ini, pasukan kejuruteraan Tagore Technology akan menyertai GLOBALFOUNDRIES untuk membangunkan lagi teknologi gallium nitride. G

Menurut berita dari laman web ini pada 1 Ogos, SK Hynix mengeluarkan catatan blog hari ini (1 Ogos), mengumumkan bahawa ia akan menghadiri Global Semiconductor Memory Summit FMS2024 yang akan diadakan di Santa Clara, California, Amerika Syarikat dari 6 hingga 8 Ogos, mempamerkan banyak produk penjanaan teknologi baru. Pengenalan kepada Sidang Kemuncak Memori dan Penyimpanan Masa Depan (FutureMemoryandStorage), dahulunya Sidang Kemuncak Memori Flash (FlashMemorySummit) terutamanya untuk pembekal NAND, dalam konteks peningkatan perhatian kepada teknologi kecerdasan buatan, tahun ini dinamakan semula sebagai Sidang Kemuncak Memori dan Penyimpanan Masa Depan (FutureMemoryandStorage) kepada jemput vendor DRAM dan storan serta ramai lagi pemain. Produk baharu SK hynix dilancarkan tahun lepas
