Rumah Peranti teknologi AI Di taman AI generatif, bagaimana NVIDIA berfungsi sebagai 'penggali'

Di taman AI generatif, bagaimana NVIDIA berfungsi sebagai 'penggali'

Jun 03, 2023 pm 06:08 PM

生成式AI的花园里 英伟达如何做“挖掘工”

Mengapa GPU NVIDIA mahal?

Pengarang: Jiang Yue

Editor: Tao Li Lu Taoran

Sumber gambar: Picture Worm

"Era pengembangan CPU telah berakhir," itulah yang diumumkan oleh pengasas dan Ketua Pegawai Eksekutif Nvidia Jen-Hsun Huang di Taipei International Computex pada 29 Mei. "Semasa ucapan yang berlangsung selama 2 jam itu, beliau memberikan pengenalan menyeluruh kepada perkakasan, perisian dan produk sistem baharu NVIDIA terkini mengenai "titik pencetus" yang dibawa oleh AI generatif.

Huang Renxun berkata bahawa "komputer baharu" yang dibentuk oleh GPU telah tiba. "Komputer" baharu yang dibina oleh Nvidia mempunyai bentuk yang berbeza daripada sebelumnya, dan unit tunggalnya dijual sehingga 200,000 dolar AS. Di tengah-tengah kontroversi "mahal", Huang Renxun juga berkata bahawa GPU adalah satu-satunya pilihan untuk setiap syarikat dengan bajet kuasa terhad, dan ia juga merupakan pilihan infrastruktur yang paling "menjimatkan".

Jensen Huang baru-baru ini berkata dalam ucapan awam bahawa dalam menghadapi era AI, orang perlu "berlari, bukan berjalan perlahan." Di taman AI generatif, Nvidia jelas menggali keras.

Menyahkod data GPU Kos jantung

"Semua orang selalu mengatakan bahawa pusat data GPU adalah mahal, biar saya mengiranya untuk anda Pada 29 Mei, pengasas dan Ketua Pegawai Eksekutif NVIDIA Jen-Hsun Huang memperkenalkan GPU kepada orang ramai secara terperinci di pusat Data Paparan Komputer Antarabangsa Taipei." .

Nvidia membawa komputer AI baharunya DGX GH200 apabila bertemu dengan pembekal dan pelanggan. Ini ialah superkomputer yang menyepadukan 256 CPU dan GPU berprestasi tinggi Nvidia, yang boleh memenuhi keperluan latihan "model yang sangat besar".

DGX GH200 menggunakan teknologi penyambungan NVIDIA NVLink-C2C untuk menyambung CPU seni bina Grace berasaskan Arm dan GPU seni bina Hopper, mencapai jumlah lebar jalur sehingga 900GB/s, yang lebih tinggi daripada saluran PCIe Gen5 standard dalam sistem pecutan tradisional 7 kali lebih pantas, kuasa pengkomputeran jenis ini dapat memenuhi aplikasi AI dan HPC generatif yang paling mencabar hari ini.

生成式AI的花园里 英伟达如何做“挖掘工”

Gambar menunjukkan cip super GH200 Grace Hopper yang diumumkan oleh NVIDIA pada 29 Mei

Foto ihsan NVIDIA

Memandangkan permintaan pasaran untuk infrastruktur pusat data berkembang, Nvidia kini juga perlu menggunakan beberapa "kaedah jualan" ke pasaran. Keperluan yang paling mendesak adalah untuk menyelesaikan ketakutan orang ramai bahawa peralatan mereka "mahal".

Ringkasnya, "Dengan menggunakan pusat data GPU, anda boleh mendapatkan 150 kali ganda prestasi dan menjimatkan 2/3 daripada kos."

Huang Renxun berkata menggunakan bajet yang sama sebanyak AS$10 juta sebagai contoh, pembangun AIGC boleh membina pusat data yang terdiri daripada 960 pelayan CPU, yang cukup untuk melatih model bahasa yang besar, dan penggunaan operasi terakhir ialah 11 gigawatt . Jam elektrik (GWj, bersamaan dengan 11 juta kilowatt-jam elektrik).

Tetapi jika anda bertukar kepada GPU, anda boleh membina pusat data yang terdiri daripada 48 pelayan GPU Walau bagaimanapun, pusat data ini boleh melatih 44 model bahasa yang besar, menggunakan jumlah 3.2 gigawatt jam (bersamaan dengan 3.2 juta kilowatt jam elektrik. ).

Mengikut kaedah pengiraan di atas, berdasarkan harga cip tunggal, harga cip GPU adalah 20 kali ganda daripada CPU, yang nampaknya "lebih mahal". Namun, mengikut kaedah pengiraan kos TCO pusat data, pusat data GPU lebih "menjimatkan wang".

Huang Renxun malah menyenaraikan formula secara langsung dalam PPT demonstrasi: kos pegangan pusat data = f {kos perkakasan (cip, sistem, ekosistem perkakasan), throughput (GPU, perisian AIgo, rangkaian, perisian sistem, Ekosistem perisian), penggunaan (AIgo Lib, ekosistem perisian), operasi perolehan, pengoptimuman kitaran hayat, kuasa pengkomputeran}, sekali gus menjelaskan isu kos TCO pusat data.

"Mengapa ini sangat penting? Kerana dalam kehidupan sebenar kebanyakan syarikat mempunyai sekatan kuasa." Apabila melabur dalam AIGC, dengan mengambil kira faktor objektif ini, perusahaan mesti memilih produk pusat data penggunaan yang lebih cekap dan berkuasa rendah.

Mengapakah GPU begitu berkuasa di pusat data? Menurut Huang Renxun, ini disebabkan terutamanya oleh tiga fungsi utama: Pengesanan sinar (mensimulasikan ciri-ciri cahaya), kecerdasan buatan dengan pengkomputeran tensor sebagai teras dan algoritma baharu.

Sejak 2017, NVIDIA telah mula melaksanakan ketiga-tiga fungsi ini pada GPU pada masa yang sama, dan penggunaan GPU untuk menjana imej telah mengejutkan pasaran buat kali pertama. Pada masa itu, ia mengambil masa beberapa jam untuk "membuat" gambar daripada tiada menggunakan pelayan CPU (proses ini dipanggil "rendering" dalam bahasa profesional), tetapi Nvidia hanya mengambil masa 15 saat menggunakan GPU.

Walau bagaimanapun, apa yang dipanggil "murahnya" komputer GPU baharu tidak ditujukan kepada pasaran pengguna. Pada masa ini, PC teras CPU dan komputer riba dalam pasaran komputer peribadi tidak boleh diganti kerana ia lebih berpatutan.

Dalam ucapannya, Huang Renxun menunjukkan komputer GPU baharu yang terdiri daripada 8 cip H100. "Ia adalah komputer paling mahal di dunia," kata Huang Renxun.

Komputer baharu ini mempunyai berat 65 paun (kira-kira 29.5 kilogram) dan memerlukan bantuan robot untuk mencapai pemasangan yang lancar dan tepat. "Komputer ini dijual pada harga AS$200,000."

Mulakan pembaharuan industri AIGC

Ini adalah penulisan semula: Langkah pertama Nvidia dalam merebut kedudukan kepimpinan AIGC ialah menghapuskan "era CPU" dengan menggunakan perkakasan. Pada masa ini, NVIDIA telah membentangkan rancangannya dengan teliti dalam ekosistem perisian Selain mempromosikan model pengkomputeran CUDA kepada 4 juta pembangun perisian, ia juga telah melancarkan perkhidmatan OEM model AI permainan, dan telah pergi jauh ke dalam industri pembuatan untuk menyokong maya. kilang dan simulasi robot Teknologi dan pengesanan automatik.

"Mengapa orang tidak dapat mencipta kaedah pengkomputeran baru selama bertahun-tahun?" Huang Renxun berkata apabila bercakap tentang era CPU. Beliau menegaskan bahawa Ini kerana terdapat hubungan "ayam-dan-telur" antara perkakasan dan perisian, pasaran pengguna serta pembangun dan pembekal, yang membawa kepada kekangan bersama dan membolehkan kaedah pengkomputeran berasaskan CPU diteruskan dan juga Long.

Oleh itu, untuk memecahkan belenggu "era CPU", Nvidia bukan sahaja bersungguh-sungguh mereka bentuk perkakasan cip, tetapi juga memberi perhatian yang besar untuk membina persekitaran ekologi perisian. Model pengkomputeran CUDA ialah bahagian penting yang NVIDIA telah buat untuk susun atur jangka panjang ini.

Lebih 3,000 aplikasi dan 4 juta pembangun kini menggunakan model pengkomputeran NVIDIA Cuda. Pada tahun lepas sahaja, Cuda telah dimuat turun sebanyak 25 juta kali, dan jumlah muat turunnya telah mencapai 40 juta. " Kata Huang Renxun. Beliau menegaskan bahawa berdasarkan perisian berskala besar itu, GPU boleh menggantikan CPU.

Merumuskan ucapan Huang Renxun selama dua jam, kita dapat melihat penerokaan NVIDIA dalam bidang AIGC, meliputi cip super teras, teknologi saling sambung, pengoptimuman enjin algoritma dan peningkatan perisian sokongan.

Malah, teks, teks, gambar, gambar 2D dan gambar 3D yang terlibat dalam AIGC sedang dilaksanakan melalui pelbagai model atau aplikasi besar, termasuk rangka kerja sumber terbuka model AI perbualan NVIDIA NeMo dan Meta model besar LLaMa, aplikasi ChatGPT menggunakan model GPT, dan aplikasi graf Vincent Stable Diffusion, dsb.

Pada masa ini, pemimpin teknologi AIGC yang paling berpengaruh di dunia menggunakan alat yang disediakan oleh NVIDIA secara mendalam, yang juga telah mendorong NVIDIA untuk mendaki puncak "1 trilion dolar A.S." dalam permodalan pasaran dalam pasaran saham A.S., dan akan segera bersaing dengan Apple, Microsoft, Google, dan Amazon berada dalam "trilion club" bersama-sama.

Pasaran dikejutkan dengan bilangan alatan yang dibawa oleh NVIDIA ke industri AIGC kali ini. Selain produk di atas, penglibatan Nvidia dalam penciptaan permainan berskala besar dan kilang digital juga sangat menarik perhatian.

Dari segi penciptaan permainan, Huang Jenxun menunjukkan klip permainan. Dalam klip ini, sebagai tambahan kepada pengeluaran gambar yang realistik, dialog antara pemain permainan dan NPC juga dijana sepenuhnya oleh AIGC. Dalam erti kata lain, permainan masa depan boleh mempunyai "ribuan muka", dan pemain tidak lagi akan menghadapi NPC yang hanya memberikan respons bercorak. ACE Game Development Edition ialah perkhidmatan faundri model AI yang disediakan oleh NVIDIA, yang boleh membantu pembangun permainan menggunakan ciri ini dengan mudah.

NVIDIA juga memperkenalkan bahawa beberapa pengeluar elektronik terkemuka kini telah menggunakan AIGC dan platform omniverse NVIDIA untuk "mendigitalkan" kilang mereka.

Dalam pembuatan, terdapat kira-kira 10 juta kilang di seluruh dunia, dan ia merupakan bidang utama untuk pendigitalan perindustrian.

Huang Renxun berkata: "Pengilangan industri adalah semua objek fizikal. Jika produk boleh dihasilkan secara digital terlebih dahulu, berbilion dolar boleh dijimatkan

Pada masa ini, dalam bidang perindustrian, NVIDIA terutamanya mencipta Omniverse dan AI generatif untuk membantu kilang mereka bentuk kilang maya Ia juga melancarkan simulasi Isaac Sim dan robot ujian serta alat automasi pemeriksaan optik Metropolis.

Difahamkan bahawa pengeluar peralatan elektronik seperti Foxconn, Pegatron, dan Quanta sudah menggunakan alat NVIDIA yang disebutkan di atas untuk mempercepatkan pengeluaran dan pemasangan komputer riba dan telefon pintar.

21Tech

Lajur khas Kumpulan Nancai

Cadangan sebelumnya

Dari Internet Industri ke AIGC: Bagaimanakah pembuatan pintar membuat lonjakan?

05-30

Ketua Pegawai Eksekutif Honor Zhao Ming: Membangunkan strategi cip atas permintaan dan mengekalkan nisbah R&D pada 10% pada 2023

05-30

Pengeluar telefon mudah alih bersaing untuk pengimejan dan skrin lipat Huawei menerangkan rahsia teknikal secara terperinci

05-29

NVIDIA menyeru untuk "berlari dan bukannya berjalan" dalam AI, berusaha dalam pengkomputeran super dan menghapuskan era CPU

05-29

Atas ialah kandungan terperinci Di taman AI generatif, bagaimana NVIDIA berfungsi sebagai 'penggali'. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan Laman Web ini
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn

Alat AI Hot

Undresser.AI Undress

Undresser.AI Undress

Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover

AI Clothes Remover

Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool

Undress AI Tool

Gambar buka pakaian secara percuma

Clothoff.io

Clothoff.io

Penyingkiran pakaian AI

AI Hentai Generator

AI Hentai Generator

Menjana ai hentai secara percuma.

Artikel Panas

R.E.P.O. Kristal tenaga dijelaskan dan apa yang mereka lakukan (kristal kuning)
1 bulan yang lalu By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Tetapan grafik terbaik
1 bulan yang lalu By 尊渡假赌尊渡假赌尊渡假赌
Akan R.E.P.O. Ada Crossplay?
1 bulan yang lalu By 尊渡假赌尊渡假赌尊渡假赌

Alat panas

Notepad++7.3.1

Notepad++7.3.1

Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina

SublimeText3 versi Cina

Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1

Hantar Studio 13.0.1

Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6

Dreamweaver CS6

Alat pembangunan web visual

SublimeText3 versi Mac

SublimeText3 versi Mac

Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Saya cuba pengekodan getaran dengan kursor AI dan ia menakjubkan! Saya cuba pengekodan getaran dengan kursor AI dan ia menakjubkan! Mar 20, 2025 pm 03:34 PM

Pengekodan Vibe membentuk semula dunia pembangunan perisian dengan membiarkan kami membuat aplikasi menggunakan bahasa semulajadi dan bukannya kod yang tidak berkesudahan. Diilhamkan oleh penglihatan seperti Andrej Karpathy, pendekatan inovatif ini membolehkan Dev

Top 5 Genai dilancarkan pada Februari 2025: GPT-4.5, Grok-3 & More! Top 5 Genai dilancarkan pada Februari 2025: GPT-4.5, Grok-3 & More! Mar 22, 2025 am 10:58 AM

Februari 2025 telah menjadi satu lagi bulan yang berubah-ubah untuk AI generatif, membawa kita beberapa peningkatan model yang paling dinanti-nantikan dan ciri-ciri baru yang hebat. Dari Xai's Grok 3 dan Anthropic's Claude 3.7 Sonnet, ke Openai's G

Bagaimana cara menggunakan Yolo V12 untuk pengesanan objek? Bagaimana cara menggunakan Yolo V12 untuk pengesanan objek? Mar 22, 2025 am 11:07 AM

Yolo (anda hanya melihat sekali) telah menjadi kerangka pengesanan objek masa nyata yang terkemuka, dengan setiap lelaran bertambah baik pada versi sebelumnya. Versi terbaru Yolo V12 memperkenalkan kemajuan yang meningkatkan ketepatan

Penjana Seni AI Terbaik (Percuma & amp; Dibayar) untuk projek kreatif Penjana Seni AI Terbaik (Percuma & amp; Dibayar) untuk projek kreatif Apr 02, 2025 pm 06:10 PM

Artikel ini mengkaji semula penjana seni AI atas, membincangkan ciri -ciri mereka, kesesuaian untuk projek kreatif, dan nilai. Ia menyerlahkan Midjourney sebagai nilai terbaik untuk profesional dan mengesyorkan Dall-E 2 untuk seni berkualiti tinggi dan disesuaikan.

Adakah chatgpt 4 o tersedia? Adakah chatgpt 4 o tersedia? Mar 28, 2025 pm 05:29 PM

CHATGPT 4 kini tersedia dan digunakan secara meluas, menunjukkan penambahbaikan yang ketara dalam memahami konteks dan menjana tindak balas yang koheren berbanding dengan pendahulunya seperti ChATGPT 3.5. Perkembangan masa depan mungkin merangkumi lebih banyak Inter yang diperibadikan

AI mana yang lebih baik daripada chatgpt? AI mana yang lebih baik daripada chatgpt? Mar 18, 2025 pm 06:05 PM

Artikel ini membincangkan model AI yang melampaui chatgpt, seperti Lamda, Llama, dan Grok, menonjolkan kelebihan mereka dalam ketepatan, pemahaman, dan kesan industri. (159 aksara)

Cara Menggunakan Mistral OCR untuk Model RAG Seterusnya Cara Menggunakan Mistral OCR untuk Model RAG Seterusnya Mar 21, 2025 am 11:11 AM

Mistral OCR: Merevolusi Generasi Pengambilan Pengambilan semula dengan Pemahaman Dokumen Multimodal Sistem Generasi Pengambilan Retrieval (RAG) mempunyai keupayaan AI yang ketara, membolehkan akses ke kedai data yang luas untuk mendapatkan respons yang lebih tepat

Pembantu Menulis AI Teratas untuk Meningkatkan Penciptaan Kandungan Anda Pembantu Menulis AI Teratas untuk Meningkatkan Penciptaan Kandungan Anda Apr 02, 2025 pm 06:11 PM

Artikel ini membincangkan pembantu penulisan AI terkemuka seperti Grammarly, Jasper, Copy.ai, WriteSonic, dan Rytr, yang memberi tumpuan kepada ciri -ciri unik mereka untuk penciptaan kandungan. Ia berpendapat bahawa Jasper cemerlang dalam pengoptimuman SEO, sementara alat AI membantu mengekalkan nada terdiri

See all articles