Gambar daripada Canva
Pada awal tahun 2023, populariti ChatGPT yang meletup dengan cepat membangkitkan perhatian industri terhadap aplikasi AI generatif, dan persaingan untuk model AI yang besar telah semakin sengit.
Sebagai pemain penting yang terlibat, Alibaba Cloud pertama kali melancarkan model besar Tongyi Qianwen di Sidang Kemuncak Awan Alibaba yang diadakan pada 11 April. Sejurus selepas 1 Jun, Alibaba Cloud mengumumkan kemajuan model berskala besar Tongyi Produk AI baharu "Tongyi Listening" yang memfokus pada kandungan audio dan video telah dilancarkan secara rasmi, menjadi produk aplikasi model berskala besar pertama di China yang dibuka kepada umum. ujian. Ini bermakna model Bahasa model berskala besar Alibaba Cloud telah mengambil satu lagi langkah besar ke arah aplikasi bahagian hadapan. Pada masa yang sama, keluaran aplikasi model besar berasaskan AInya adalah setara dengan menjatuhkan blockbuster pada "perkelahian model besar" yang dipertikaikan semasa.
Perang Seribu Model hampir meletus
Dalam beberapa bulan kebelakangan ini, syarikat utama Silicon Valley seperti Microsoft, Google dan Amazon telah mengumumkan model besar dan kemajuan AIGC, dan memulakan persaingan AI melalui beberapa siri aplikasi seperti enjin carian AI dan perisian pejabat AI, syarikat awan Internet domestik juga telah Seluruh tentera menyerang satu demi satu. Bukan sahaja pengeluar besar, tetapi juga banyak syarikat pemula, institusi VC/PE, dan gergasi dari pelbagai industri telah mencurah-curah ke dalam trek model besar AI, cuba untuk mendapatkan secebis tindakan. Mengikut statistik yang tidak lengkap, pada masa ini terdapat tidak kurang daripada 50 syarikat besar yang telah mengumumkan rancangan untuk melancarkan model AI yang besar, dan terdapat banyak peserta lain.
Dari sudut pandangan struktur, syarikat teknologi Internet yang diwakili oleh "BATH" dan lain-lain telah berada pada kedudukan yang kukuh dalam eselon pertama industri berdasarkan kekuatan komprehensif mereka seperti senario, kuasa pengkomputeran, dan keupayaan teknikal timbunan penuh; semasa mereka berada di peringkat kedua Syarikat industri penting, seperti SenseTime, China Telecom, JD.com, 360, dsb., telah bergantung pada pengaruh mereka dalam bidang berkaitan untuk mendapat kedudukan dalam eselon kedua industri ; diikuti rapat oleh pelbagai gergasi industri, termasuk pengasas bersama usahawan terkenal Meituan seperti Wang Huiwen dan bekas Ketua Pegawai Eksekutif Sogou Wang Xiaochuan mempunyai pengetahuan, sokongan institusi dan latar belakang yang relevan, bagaimanapun, kerana mereka masih di peringkat awal ditempatkan sementara di eselon ketiga dalam jarak dekat model AI yang besar.
Dari sudut pandangan klasifikasi, setiap perusahaan mempunyai kedudukan dan pembahagian kerja sendiri di sekitar model besar am dan model besar khas. Menurut orang dalam industri, model besar domestik semasa boleh dibahagikan kepada dua kategori: satu ialah model besar umum yang menanda aras GPT, memfokuskan pada syarikat di peringkat asas, seperti Alibaba, Baidu dan syarikat lain berdasarkan terbuka sumber model besar Kami melatih model menegak besar pada platform, memfokuskan pada syarikat dalam industri menegak, seperti model menegak besar yang digunakan dalam bidang kewangan, penjagaan perubatan, pengangkutan dan bidang lain. Disebabkan oleh keperluan teknikal yang tinggi dan kos yang tinggi dari bekas, banyak industri telah mula bekerjasama dengan syarikat model besar am untuk melatih model besar menegak yang sesuai untuk industri mereka sendiri berdasarkan keadaan mereka sendiri.
Dari perspektif rantaian industri, pengeluar kuasa pengkomputeran, pengeluar perkhidmatan awan dan pengeluar aplikasi bahagian hadapan semuanya terlibat. Pada masa ini, termasuk pengeluar kuasa pengkomputeran NVIDIA, pengeluar perkhidmatan awan Alibaba Cloud, dan pengeluar aplikasi bahagian hadapan seperti Kingsoft Office, UFIDA dan Teknologi Yuncong, mereka semua secara aktif mengambil bahagian dalam penyelidikan dan pembangunan teknologi serta pelaksanaan senario model besar AI. Pendek kata, huru-hara semasa ke atas model AI besar memanas secara tiba-tiba.
Tongyi Tingwu melancarkan tangkapan pertama aplikasi model besar
Dari perspektif tahap yang terlibat dalam model AI besar, ia boleh dibahagikan terutamanya kepada empat tahap: lapisan aplikasi, lapisan model, lapisan rangka kerja dan lapisan cip Pada masa ini, kebanyakan syarikat di pasaran masih berada di lapisan model , dan pergi lebih mendalam Ia melibatkan penyelidikan pada lapisan rangka kerja dan lapisan cip, dan aplikasi bahagian hadapan pada masa ini tidak tersedia dalam industri. Sebagai produk aplikasi model berskala besar pertama dalam industri dalam beta awam, kesan demonstrasi Tongyi Tingwu sangat jelas.
Di satu pihak, berbanding dengan teknologi asas, nilai teknologi yang hampir dengan bahagian hadapan aplikasi akan menjadi lebih imaginatif. Melihat kepada sejarah semua evolusi teknologi, tidak sukar untuk mendapati bahawa nilai teras teknologi terletak pada populariti aplikasinya dan sejauh mana ia menyelesaikan masalah pengguna. Oleh sebab itu, aplikasi bahagian hadapan yang melaksanakan tanggungjawab dan misi ini selalunya mempunyai ruang yang lebih besar untuk imaginasi.
Ambil Tongyi Listening, yang dilancarkan oleh Alibaba Cloud pada 1 Jun, sebagai contoh Dengan menyambung kepada model besar Tongyi Alibaba, peranannya bukan lagi sekadar alat mudah untuk transkripsi audio dan video, tetapi ia telah menjadi alat yang cekap. Pembantu AI untuk membantu orang dalam senario audio dan video. Ia menyediakan orang ramai dengan pelbagai perkhidmatan pejabat seperti mengambil nota secara automatik, menganjurkan temu bual, dan mengekstrak PPT Ia juga boleh merealisasikan keupayaan untuk menukar audio dan video kepada kandungan grafik, meringkaskan bab demi bab, dan meringkaskan pendapat teks penuh mempunyai keupayaan pencarian dan pengelasan yang cekap "seperti manusia".
Selain itu, dalam senario terbahagi, ia juga mempunyai banyak fungsi "harta karun", seperti keupayaan untuk membuka pemalam Chrome Pelajar bahasa asing dan orang cacat pendengaran boleh menggunakan bar sari kata terapung dwibahasa untuk menonton video tanpa. sari kata pada bila-bila masa dan di mana-mana tanpa percanggahan jadual Pada masa yang sama, Tingwu juga boleh menjadi "meeting stand-in" untuk profesional Apabila mesyuarat diredam, AI boleh merekodkan mesyuarat dan mengatur keputusan transkripsi boleh dimuat turun sebagai fail sari kata untuk memudahkan penerbitan video oleh pengamal media baharu Tingwu menganjurkan Semakan Soal Jawab membolehkan wartawan, penganalisis, peguam, HR dan kumpulan lain mengatur wawancara dengan lebih cekap. Ringkasnya, dari segi keupayaannya untuk menyelesaikan masalah adegan tertentu, ia telah melebihi keupayaan aplikasi audio dan video yang sedia ada, dan juga telah menyegarkan had atas pengalaman pengguna sebelumnya. Ia pasti akan menimbulkan kekecohan dalam industri.
Sebaliknya, dari Alibaba Cloud sendiri, model besar Tongyi Qianwen baru sahaja dilancarkan, dan ia boleh melancarkan aplikasi teknikal dengan cepat berdasarkan model besar AI, yang menunjukkan bahawa Alibaba Cloud AI besar model sememangnya agak matang , mempunyai keupayaan untuk memperoleh aplikasi AI.
Dari lapisan model kepada lapisan aplikasi, daripada model besar AI sehingga lahirnya aplikasi model besar, ia nampak mudah tetapi sebenarnya ia bukanlah mudah untuk dilaksanakan. Secara umumnya, aplikasi menegak dilaksanakan berdasarkan asas teknikal model besar umum Mengetepikan model besar umum, ini biasanya mustahil untuk dilaksanakan, dan ini memerlukan model besar umum yang mana ia bergantung cukup matang, jika tidak, ia. akan menjadi sangat sukar untuk dilaksanakan Sukar untuk melancarkan aplikasi yang agak mudah digunakan dan melebihi keupayaan produk sedia ada. Ambil Tongyi Tingwu sebagai contoh, kekuatan teknikalnya tidak dikongsi oleh semua pemain dalam industri.
Infrastruktur AI sistem penuh menjadi kunci kemenangan
Dari perspektif ratusan bilion keperluan latihan parameter yang diperlukan oleh model AI yang besar itu sendiri, kesukaran dan kerumitan kemajuannya mungkin jauh melebihi imaginasi dunia luar. Dalam jangka panjang, hanya syarikat yang mempunyai keupayaan teknikal model besar AI tindanan penuh dan keupayaan infrastruktur akan dapat pergi lebih jauh.
Pertama, kerana kelajuan pembangunan AI generatif jauh melebihi jangkaan luaran, kemajuan mana-mana pautan tunggal mempunyai kesan terhad ke atas mempromosikan keseluruhan latihan model besar. Menurut pengiraan OpenAI, sejak 2012, permintaan global untuk kuasa pengkomputeran untuk latihan model AI telah meningkat dua kali ganda dalam 3-4 bulan, dengan kadar pertumbuhan tahunan sehingga 10 kali ganda. Walau bagaimanapun, menurut Undang-undang Moore, prestasi pengkomputeran cip hanya boleh berganda setiap 18-24 bulan, yang bermaksud bahawa prestasi cip jauh daripada mengikuti keperluan pembangunan model AI yang besar. Khusus untuk bidang yang berkaitan, sistem pengkomputeran berasaskan CPU sukar untuk memenuhi keperluan penghantaran rangkaian jalur lebar dan kependaman rendah untuk latihan model besar Sukar untuk menyelesaikan masalah ini dalam jangka pendek dengan bergantung pada satu "timbunan pengkomputeran kuasa". , dan mungkin tidak menjimatkan. Kita mesti bergantung pada sokongan keseluruhan sistem berbilang peringkat daripada algoritma, kuasa pengkomputeran, rangka kerja, dll. untuk menghadapi perubahan ini dengan lebih baik.
Kedua, disebabkan kuasa pengkomputeran yang besar yang diperlukan untuk membangunkan model besar tujuan umum, kos latihan inferens yang tinggi dan keperluan volum data yang tinggi, ambang itu sendiri adalah sangat tinggi, dan ia tidak mempunyai keupayaan untuk membangunkan model besar susun penuh dan melaksanakan senario Syarikat yang mempunyai keupayaan yang lemah dan keterbukaan ekologi akan mendapati sukar untuk mengekalkan kadar perubahan yang pantas dan akan mudah dihapuskan. Menurut analisis oleh orang dalam industri, untuk mencipta model besar sejagat yang berjaya yang boleh dieksport untuk pengkomersialan luaran, pengilang perlu mempunyai latihan model besar yang besar dan keupayaan R&D, pengalaman pelaksanaan senario perniagaan, langkah tadbir urus keselamatan AI, dan keterbukaan ekologi dan kelebihan teras lain, dan sukar bagi perusahaan biasa untuk memiliki sepenuhnya keupayaan ini.
Sebagai penyedia perkhidmatan pengkomputeran awan pertama di Asia dan yang ketiga di dunia, Alibaba Cloud mempunyai sistem sokongan kuasa pengkomputeran terkuat di China. Sebagai contoh, sistem pengendalian Cloud Feitian Cloud Alibaba boleh mencapai skala kluster tunggal sebanyak 100,000 unit dan kapasiti pengkomputeran sebanyak 100 bilion fail Platform pengkomputeran pintar Feitian boleh mencapai kecekapan selari 90% daripada 1,000 kad yang dibangunkan sendiri 10,000 kad skala kluster AI menyediakan keupayaan komunikasi kluster berprestasi tinggi tanpa kesesakan, PAI platform pembelajaran mendalam Alibaba Cloud boleh meningkatkan penggunaan sumber pengkomputeran lebih daripada 3 kali, kecekapan latihan AI sebanyak 11 kali, dan kecekapan inferens sebanyak 6 kali. . Selain itu, Alibaba Cloud juga telah menerajui dalam mewujudkan komuniti perkhidmatan model AI terbesar di China, "Magic", untuk mengurangkan kos pembangunan model yang besar dan membantu keterangkuman AI dari segi algoritma, Alibaba mempunyai bahasa yang maju dan berbilang-; keupayaan modal, model ultra-besar dan model bersatu sejagat Dalam banyak dimensi teknikal, ia berada di eselon pertama di China Ini adalah sebab utama mengapa model besar Ali Tongyi boleh "keluar dari bulatan".
Ketiga, dari perspektif kemungkinan perniagaan, syarikat yang mempunyai keupayaan infrastruktur AI sistem penuh akan mempunyai nilai perniagaan yang lebih besar selepas ketibaan MaaS (Model sebagai Perkhidmatan) dan akan mempunyai "ruang untuk bergerak". ". Ambil Alibaba Cloud sebagai contoh Dalam tempoh kemudian, anda bukan sahaja boleh mendapatkan bayaran perkhidmatan platform dengan menyediakan perkhidmatan model besar umum, anda juga boleh menyewakan kuasa pengkomputeran dan mempromosikan platform latihan untuk mendapatkan sewa laluan, dan anda boleh bersaing dalam pasaran Melaraskan harga produk secara fleksibel berdasarkan keadaan untuk menangani cabaran operasi.
Industri mengalu-alukan era AI HP
Dengan kelahiran aplikasi model besar AI, era baharu yang dicirikan oleh keterangkuman AI mendalam secara beransur-ansur bermula dengan mendalam dalam entiti perindustrian dan akan menjadi trend industri yang tidak dapat dipulihkan.
Di satu pihak, ambang tinggi model besar am dan pelbagai keperluan yang berbeza dalam bidang menegak menentukan model besar eksklusif dan aplikasi perindustrian berdasarkan model besar umum akan menjadi arah aplikasi arus perdana pada masa hadapan , menggalakkan pecutan AI Memasuki beribu-ribu industri. Seperti yang dinyatakan di atas, ambang tinggi untuk model besar tujuan umum menentukan bahawa hanya beberapa syarikat di dalam dan luar negara boleh membuat model besar untuk kegunaan umum Dan apabila model AI menjadi lebih besar, industri AI beralih daripada a industri ringan yang terdiri daripada "bengkel buatan tangan" kepada Pengeluaran intensif memerlukan infrastruktur sistematik berprestasi tinggi, kos rendah untuk melengkapkan pengeluaran perindustrian.
Bukan sahaja banyak perusahaan kecil dan sederhana tidak mempunyai keupayaan ini, malah untuk syarikat terkemuka dalam pelbagai industri, mengoptimumkan latihan model besar dari 0 hingga 1 adalah tidak menjimatkan semua lapisan masyarakat memerlukan infrastruktur AI kos yang cukup rendah. Dan bagi pengeluar sedia ada, tidak perlu terus menyertai bidang ini dan "mencipta semula roda." Sebaliknya, kos latihan model menegak yang besar adalah agak rendah, dan sesetengah syarikat yang mempunyai senario data yang kaya dalam bidang profesional mempunyai keadaan yang lebih baik untuk membina model menegak yang besar dan kualiti data yang lebih baik, dan produk yang dilancarkan lebih mudah disesuaikan dengan industri menegak. Oleh itu, GPT dalam pelbagai industri menegak mungkin menjadi aplikasi model besar arus perdana pada masa hadapan, menggalakkan penembusan pesat AI ke dalam industri.
Sebaliknya, kesesakan jangka pendek dalam membangunkan model AI yang besar ialah kuasa pengkomputeran, dan dalam jangka panjang ialah data Oleh itu, aplikasi bahagian hadapan yang berkualiti tinggi boleh membantu mempercepatkan pengumpulan data yang mencukupi aset oleh perusahaan dan meningkatkan daya saing jangka panjang mereka Mempercepatkan proses aplikasi industri yang inklusif. Pada masa ini, lelaran pantas dan evolusi model besar memaksa semua pemain yang mengambil bahagian untuk terus mengumpul sumber pengkomputeran dan mengoptimumkan konfigurasi daripada pelbagai aspek seperti cip dan perkhidmatan awan untuk memastikan sokongan kuasa pengkomputeran yang diperlukan untuk latihan model besar. Walau bagaimanapun, dalam jangka panjang, algoritma untuk melatih model AI yang besar masih terus dioptimumkan dan diselaraskan Dengan penemuan dalam algoritma pada masa hadapan, kuasa pengkomputeran mungkin tidak lagi menjadi halangan dan sumber data berkualiti tinggi akan menjadi terhad. sumber , akan mendapat lebih perhatian.
Sebagai aplikasi pertama industri berdasarkan model AI yang besar, pelancaran Tongyi Tingwu akan membantu Alibaba mempercepatkan pengumpulan sumber data berkualiti tinggi, mempercepatkan proses keterangkuman industri dan meletakkan asas yang baik untuk pembangunan jangka panjang.
Atas ialah kandungan terperinci Di sebalik kelahiran Tongyi Tingwu, gambar pertama aplikasi tindak balas model besar AI. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!