Amazon sedang berusaha sedaya upaya untuk mempertahankan kepimpinannya dalam pengkomputeran awan. Di satu pihak, mereka menaik taraf cip awan mereka sendiri dan melancarkan versi Amazon GPT, sebuah chatbot kecerdasan buatan sebaliknya, mereka juga memperdalam kerjasama dengan NVIDIA, melancarkan perkhidmatan baharu berdasarkan cip NVIDIA, dan bersama-sama membangunkannya dengan NVIDIA; superkomputer
Dave Brown, naib presiden AWS, berkata dengan memfokuskan reka bentuk cip yang dibangunkan sendiri pada beban kerja sebenar yang penting kepada pelanggan, AWS boleh memberikan mereka infrastruktur awan yang paling maju. Graviton 4 yang dilancarkan kali ini merupakan produk cip generasi keempat dalam tempoh lima tahun Memandangkan minat orang ramai terhadap AI generatif meningkat, cip AI generasi kedua Trainium 2 akan membantu pelanggan melatih diri mereka dengan lebih pantas pada kos yang lebih rendah dan model pembelajaran mesin yang lebih tinggi.
Prestasi pengkomputeran Graviton4 dipertingkatkan sehingga 30% berbanding generasi sebelumnya
Pada hari Selasa, 28 November, Eastern Time, perniagaan pengkomputeran awan Amazon AWS mengumumkan pelancaran generasi baharu cip AWS yang dibangunkan sendiri. Antaranya, prestasi pengkomputeran cip kegunaan umum Graviton4 adalah sehingga 30% lebih tinggi daripada generasi sebelumnya Graviton3, teras meningkat sebanyak 50%, dan lebar jalur memori meningkat sebanyak 75%, sekali gus memberikan prestasi kos tertinggi dan penggunaan tenaga pada perkhidmatan pengehosan pelayan awan Amazon Amazon Elastic Compute Cloud (EC2) Effect.
Graviton4 meningkatkan keselamatan dengan menyulitkan sepenuhnya semua antara muka perkakasan fizikal berkelajuan tinggi. AWS berkata Graviton4 akan tersedia pada contoh Amazon EC2 R8g yang dioptimumkan memori untuk membantu pelanggan meningkatkan pelaksanaan pangkalan data berprestasi tinggi, cache dalam memori dan beban kerja analitik data besar. Tika R8g menawarkan saiz tikar yang lebih besar dengan sehingga tiga kali lebih banyak vCPU dan tiga kali lebih banyak memori daripada tika R7g generasi sebelumnya
Dalam beberapa bulan akan datang, kami merancang untuk melancarkan komputer yang dilengkapi dengan Graitons4. AWS mengatakan bahawa dalam tempoh lima tahun sejak projek Garviton dilancarkan, lebih daripada 2 juta pemproses Garviton telah dihasilkan, dan 100 pengguna pertama AWS EC2 telah memilih untuk menggunakan Graviton
Trainium2 adalah empat kali lebih pantas dan boleh melatih model dengan trilion parameter
AWS telah melancarkan cip AI generasi baharu yang dipanggil Trainium2, yang empat kali lebih pantas daripada Trainium1 generasi sebelumnya. Trainium2 boleh menggunakan sehingga 100,000 cip dalam EC2 UltraCluster, membolehkan pengguna melatih model asas (PM) dan model bahasa besar (LLM) dengan trilion parameter dalam masa yang singkat. Berbanding dengan generasi sebelumnya, penggunaan tenaga Trainium2 telah digandakan
Trainium2 akan digunakan pada contoh Amazon EC2 Trn2, setiap satu mengandungi 16 cip Trainium. Contoh Trn2 direka bentuk untuk membantu pelanggan menskalakan bilangan aplikasi cip dalam UltraCluster EC2 generasi akan datang kepada sehingga 100,000 cip Trainium2 dan menyediakan sehingga 65 Exach kuasa pengkomputeran melalui sambungan rangkaian skala petabyte melalui AWS Elastic Fabrication Adapters (EFA)
Menurut AWS, Trainium2 akan digunakan untuk menyokong perkhidmatan baharu mulai tahun depan
Pelanggan utama pertama DGX Cloud menggunakan versi Grace Hopper GH200 NVL32 yang dinaik taraf, GPU ini memacu superkomputer AI terpantas
Semasa persidangan tahunan re:Invent, AWS dan NVIDIA mengumumkan pada hari Selasa kerjasama strategik yang diperluas untuk menyediakan infrastruktur, perisian dan perkhidmatan terkini untuk mempromosikan inovasi AI generatif pelanggan. Kerjasama ini bukan sahaja melibatkan cip yang dibangunkan sendiri, tetapi juga merangkumi kerjasama dalam bidang lain
AWS akan menjadi penyedia perkhidmatan awan pertama yang menggunakan cip super NVLink berbilang nod baharu NVIDIA H200 Grace Hopper dalam awan Dalam erti kata lain, AWS akan menjadi pelanggan penting pertama bagi versi Grace Hopper yang dinaik taraf
Platform berbilang nod H200 NVL32 NVIDIA menggunakan 32 cip Grace Hopper dengan teknologi NVLink dan NVSwitch dalam satu contoh. Platform ini akan digunakan pada contoh Amazon EC2 yang disambungkan ke Amazon Network EFA dan dikuasakan oleh virtualisasi lanjutan (AWS Nitro System) dan kluster skala ultra (Amazon EC2 UltraClusters), membolehkan pelanggan Amazon dan Nvidia menskalakan penggunaan kepada beribu-ribu Cip H200NVIDIA dan AWS akan bekerjasama untuk menganjurkan latihan AI NVIDIA sebagai perkhidmatan DGX Cloud pada AWS. Ini akan menjadi DGX Cloud pertama yang menampilkan GH200 NVL32, menyediakan pembangun dengan satu contoh dengan memori dikongsi maksimum. Awan DGX AWS akan meningkatkan keupayaan latihan AI generatif termaju dan model bahasa besar dengan lebih 1 trilion parameter
NVIDIA dan AWS bekerjasama dalam projek yang dipanggil Ceiba untuk mereka bentuk superkomputer AI berkuasa GPU terpantas di dunia. Dikuasakan oleh GH200 NVL32 dan teknologi antara sambungan Amazon EFA, komputer ini merupakan sistem yang besar. Ia dilengkapi dengan 16,384 cip super GH200 dan mempunyai 65 exaflop kuasa pemprosesan AI. NVIDIA merancang untuk menggunakannya untuk memacu gelombang inovasi AI generatif seterusnya
Versi pratonton Amazon Q, bot pelanggan perusahaan, kini dalam talian dan boleh membantu pembangun membangunkan aplikasi di AWS
Selain menyediakan perkhidmatan cip dan awan, AWS juga mengeluarkan versi pratonton bot sembang AI yang dipanggil Amazon Q. Amazon Q ialah jenis pembantu digital baharu yang menggunakan teknologi AI generatif untuk berfungsi berdasarkan keperluan perniagaan pelanggan perusahaan. Ia membantu pelanggan perusahaan mencari maklumat, menulis kod dan menyemak metrik perniagaan
Q telah menerima beberapa latihan tentang kod dan dokumentasi dalam AWS, yang boleh digunakan oleh pembangun dalam awan AWS.
Pembangun boleh menggunakan Q untuk membuat aplikasi pada AWS, menyelidik amalan terbaik, membetulkan ralat dan mendapatkan bantuan menulis ciri baharu untuk aplikasi mereka. Pengguna boleh berinteraksi dengan Q melalui Soal Jawab perbualan untuk mempelajari pengetahuan baharu, menyelidik amalan terbaik dan memahami cara membina aplikasi pada AWS tanpa meninggalkan konsol AWS
Amazon akan menambahkan Q pada program untuk perisian risikan perusahaan, pekerja pusat panggilan dan pengurusan logistik. AWS berkata pelanggan boleh menyesuaikan Q berdasarkan data syarikat atau profil peribadi
Soal Jawab Perbualan kini tersedia dalam pratonton di semua wilayah perusahaan yang disediakan oleh AWS
Atas ialah kandungan terperinci Amazon berusaha untuk mempertahankan status awannya, meningkatkan cip AI yang dibangunkan sendiri, mengeluarkan robot sembang Q, dan merupakan yang pertama menggunakan cip super generasi baharu Nvidia. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!