Universiti Tsinghua dan sumber terbuka Zhipu AI GLM-4: melancarkan revolusi baharu dalam pemprosesan bahasa semula jadi-AI-php.cn

Jadual Kandungan

Berdasarkan pra-latihan yang kukuh, penguasaan bahasa Cina dan Inggeris yang komprehensif GLM-4-9B telah meningkat sebanyak 40% berbanding ChatGLM3-6B. Khususnya, peningkatan ketara telah dicapai dalam keupayaan penjajaran Cina AlignBench, keupayaan pematuhan perintah IFeval, dan keupayaan pemprosesan kod kejuruteraan Natural Code Bench. Walaupun apabila membandingkan model Llama 3 8B dengan volum latihan yang lebih banyak, GLM-4-9B sama sekali tidak kalah dan mendahului dalam prestasi Bahasa Inggeris Dalam bidang mata pelajaran Bahasa Cina, GLM-4-9B telah meningkat sehingga 50% [Prestasi. Carta penilaian].

Keupayaan pemprosesan teks panjang

All Tools Full Tools Call

Rumah

Peranti teknologi

Universiti Tsinghua dan sumber terbuka Zhipu AI GLM-4: melancarkan revolusi baharu dalam pemprosesan bahasa semula jadi

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

Jun 12, 2024 pm 08:38 PM

ai kod glm-4

Sejak pelancaran ChatGLM-6B pada 14 Mac 2023, model siri GLM telah mendapat perhatian dan pengiktirafan yang meluas. Terutama selepas ChatGLM3-6B menjadi sumber terbuka, pembangun penuh dengan jangkaan untuk model generasi keempat yang dilancarkan oleh Zhipu AI. Jangkaan ini akhirnya telah berpuas hati sepenuhnya dengan keluaran GLM-4-9B.

Kelahiran GLM-4-9B

Untuk memberikan model kecil (10B ke bawah) keupayaan yang lebih berkuasa, pasukan teknikal GLM melancarkan model sumber terbuka siri GLM generasi keempat baharu ini selepas hampir setengah tahun penerokaan :GLM-4-9B. Model ini sangat memampatkan saiz model sambil memastikan ketepatan, dan mempunyai kelajuan inferens yang lebih pantas dan kecekapan yang lebih tinggi. Tiada penghujung penerokaan pasukan teknikal GLM, dan kami akan terus bekerja keras untuk melancarkan sumber terbuka yang lebih kompetitif

teknologi pra-latihan yang inovatif

Semasa proses pra-latihan, kami memperkenalkan model bahasa yang besar untuk saringan data, dan akhirnya memperoleh data Berbilang bahasa berkualiti tinggi 10T. Jumlah data ini adalah lebih daripada tiga kali ganda daripada model ChatGLM3-6B. Selain itu, kami menggunakan teknologi FP8 untuk pra-latihan yang cekap, yang meningkatkan kecekapan latihan sebanyak 3.5 kali berbanding model generasi ketiga. Dengan mengambil kira keperluan storan pengguna, saiz parameter GLM-4-9B telah dinaikkan daripada 6B kepada 9B. Akhirnya, kami meningkatkan pengiraan pra-latihan sebanyak 5 kali untuk memaksimumkan keupayaan prestasi di bawah keadaan penyimpanan terhad. . dan kelebihan lain. Peningkatan ini memberikan pengguna sokongan teknikal yang lebih stabil, lebih dipercayai dan lebih tepat serta meningkatkan kecekapan dan kualiti kerja pengguna.

Siri GLM-4-9B termasuk berbilang versi:

Versi asas: GLM-4-9B (8K) Versi perbualan: GLM-4-9B-Chat (128K)

Versi lebih panjang: GLM-4-9B-Chat-1M (1M)

Keupayaan berkuasa GLM-4-9B
Baik

Berdasarkan pra-latihan yang kukuh, penguasaan bahasa Cina dan Inggeris yang komprehensif GLM-4-9B telah meningkat sebanyak 40% berbanding ChatGLM3-6B. Khususnya, peningkatan ketara telah dicapai dalam keupayaan penjajaran Cina AlignBench, keupayaan pematuhan perintah IFeval, dan keupayaan pemprosesan kod kejuruteraan Natural Code Bench. Walaupun apabila membandingkan model Llama 3 8B dengan volum latihan yang lebih banyak, GLM-4-9B sama sekali tidak kalah dan mendahului dalam prestasi Bahasa Inggeris Dalam bidang mata pelajaran Bahasa Cina, GLM-4-9B telah meningkat sehingga 50% [Prestasi. Carta penilaian].

Keupayaan pemprosesan teks panjang

Gambar

Panjang konteks model GLM-4-9B+ telah dilanjutkan daripada 128K kepada 1M token, yang bermaksud ia boleh memproses input sehingga 2 juta perkataan masa yang sama, yang bersamaan dengan dua buku "Dream of Red Mansions" ” atau panjang 125 kertas akademik. Model GLM-4-9B-Chat-1M berjaya menunjukkan keupayaan cemerlangnya untuk memproses input teks panjang tanpa merosakkan dalam eksperimen "jarum dalam timbunan jerami" [ilustrasi percubaan teks panjang].

Berikut ialah dua kes video demo yang menunjukkan keupayaan pemprosesan teks panjang: 清华大学与智谱AI重磅开源 GLM-4：掀起自然语言处理新革命

GLM-4-9B-Model Sembang:

Input 5 fail PDF dengan jumlah panjang kira-kira 128K, dan tulis artikel tentang Prompt for laporan penyelidikan terperinci mengenai pembangunan model besar di China. Model ini boleh menjana laporan penyelidikan berkualiti tinggi dengan cepat (video tidak dipercepatkan).

GLM-4-9B-Chat-1M Model: Masukkan kira-kira 900,000 perkataan dalam koleksi lengkap "The Three-Body Problem" dan minta model menulis rangka sekuel untuk novel tersebut. Model ini dirancang dengan munasabah dan menyediakan rangka kerja kesinambungan (video dipercepatkan 10 kali).
Sokongan berbilang bahasaGLM-4-9B+ menyokong sehingga 26 bahasa, termasuk bahasa Cina, Inggeris, Rusia, dll. Kami mengembangkan saiz perbendaharaan kata tokenizer daripada 65K kepada 150K, meningkatkan kecekapan pengekodan sebanyak 30%. Dalam tugas pemahaman dan penjanaan berbilang bahasa, GLM-4-9B-Chat mengatasi prestasi Llama-3-8B-Instruct [carta perbandingan prestasi berbilang bahasa].

Keupayaan Panggilan Fungsi

Keupayaan panggilan fungsi GLM-4-9B telah meningkat sebanyak 40% berbanding generasi sebelumnya Pada Papan Pendahulu Panggilan Fungsi Berkeley, keupayaan Panggilan Fungsinya adalah setanding dengan GPT-4 [Prestasi Panggilan Fungsi. Carta perbandingan].

All Tools Full Tools Call

Keupayaan "All Tools" bermakna model boleh memahami dan menggunakan pelbagai alatan luaran (seperti pelaksanaan kod, penyemakan imbas rangkaian, lukisan, dll.) untuk membantu menyelesaikan tugasan. Pada Zhipu DevDay pada 16 Januari, model GLM-4 telah dinaik taraf sepenuhnya dengan keupayaan Semua Alat, yang boleh memanggil penyemak imbas web, jurubahasa kod, CogView dan alatan lain secara bijak untuk menyelesaikan permintaan yang rumit [ikon tugas Semua Alat].

Pemprosesan berbilang modal

GLM-4V-9B, model berbilang modal sumber terbuka berdasarkan GLM-4, mampu memproses input resolusi tinggi, mencampurkan terus data visual dan teks untuk latihan, menunjukkan luar biasa Kesan pemprosesan berbilang modal adalah bersamaan dengan prestasi GPT-4V. Ia berfungsi dengan baik apabila mengenal pasti dan memproses tugas berbilang modal yang kompleks [gambar rajah contoh aplikasi berbilang modal].

清华大学与智谱AI重磅开源 GLM-4：掀起自然语言处理新革命 Pictures

Tinjauan Masa Depan

GLM-4-9B telah menunjukkan prestasi hebatnya dalam pelbagai tugas dan merupakan satu kejayaan dalam bidang pemprosesan bahasa semula jadi. Sama ada penyelidikan akademik atau aplikasi industri, GLM-4-9B akan menjadi pilihan terbaik anda.

Kami dengan ikhlas menjemput anda untuk menyertai barisan pengguna GLM-4 dan menerokai kemungkinan yang dibawa oleh model yang sangat baik ini:

Repositori GitHub
Halaman model Memeluk Wajah
Komuniti Ajaib

Atas ialah kandungan terperinci Universiti Tsinghua dan sumber terbuka Zhipu AI GLM-4: melancarkan revolusi baharu dalam pemprosesan bahasa semula jadi. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan Laman Web ini

Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn

Alat AI Hot

Undresser.AI Undress

Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover

Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool

Gambar buka pakaian secara percuma

Clothoff.io

Penyingkiran pakaian AI

Video Face Swap

Tukar muka dalam mana-mana video dengan mudah menggunakan alat tukar muka AI percuma kami!

Tunjukkan Lagi

Artikel Panas

Bagaimana untuk memperbaiki KB5055612 gagal dipasang di Windows 10?

4 minggu yang lalu By DDD

<🎜>: Bubble Gum Simulator Infinity - Cara Mendapatkan dan Menggunakan Kekunci Diraja

4 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌

<🎜>: Tumbuh Taman - Panduan Mutasi Lengkap

3 minggu yang lalu By DDD

Nordhold: Sistem Fusion, dijelaskan

4 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌

Mandragora: Whispers of the Witch Tree - Cara Membuka Kunci Cangkuk Bergelut

3 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌

Tunjukkan Lagi

Alat panas

Notepad++7.3.1

Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina

Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1

Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6

Alat pembangunan web visual

SublimeText3 versi Mac

Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Tunjukkan Lagi

Topik panas

Tutorial Java

1672

Tutorial CakePHP

1428

Tutorial Laravel

1332

Tutorial PHP

1277

Tutorial C#

1257

Tunjukkan Lagi

Related knowledge

10 platform dagangan mata wang digital teratas: 10 pertukaran mata wang digital yang selamat dan boleh dipercayai Apr 30, 2025 pm 04:30 PM

Platform perdagangan mata wang maya digital 10 digital adalah: 1. Binance, 2 Okx, 3. Coinbase, 4. Kraken, 5. Huobi Global, 6. Bitfinex, 7. Kucoin, 8 Gemini, 9. Platform ini semua menyediakan keselamatan yang tinggi dan pelbagai pilihan perdagangan, sesuai untuk keperluan pengguna yang berbeza.

Kedudukan Pertukaran Kuantitatif 2025 Cadangan Top 10 untuk Aplikasi Perdagangan Kuantitatif Mata Wang Digital Apr 30, 2025 pm 07:24 PM

Alat kuantisasi terbina dalam pertukaran termasuk: 1. Binance: Menyediakan modul kuantitatif niaga hadapan Binance, yuran pengendalian yang rendah, dan menyokong urus niaga AI-dibantu. 2. OKX (OUYI): Menyokong Pengurusan Multi Akaun dan Routing Pesanan Pintar, dan menyediakan kawalan risiko peringkat institusi. Platform strategi kuantitatif bebas termasuk: 3. 4. Kuadensi: Perpustakaan Strategi Algoritma Tahap Profesional, menyokong ambang risiko yang disesuaikan. 5. PionEx: Strategi Preset 16 terbina dalam, yuran transaksi yang rendah. Alat domain menegak termasuk: 6. Cryptohopper: platform kuantitatif berasaskan awan, menyokong 150 petunjuk teknikal. 7. Bitsgap:

EaseProtocol.com secara langsung melaksanakan standard mesej ISO 20022 sebagai kontrak pintar blockchain Apr 30, 2025 pm 05:06 PM

Pembangunan terobosan ini akan membolehkan institusi kewangan memanfaatkan piawaian ISO20022 yang diiktiraf secara global untuk mengautomasikan proses perbankan di seluruh ekosistem blockchain yang berbeza. Protokol Ease adalah platform blockchain peringkat perusahaan yang direka untuk mempromosikan penggunaan yang meluas melalui kaedah yang mudah digunakan. Ia mengumumkan hari ini bahawa ia telah berjaya menggabungkan standard pemesejan ISO20022 dan terus memasukkannya ke dalam kontrak pintar blockchain. Pembangunan ini akan membolehkan institusi kewangan dengan mudah mengautomasikan proses perbankan dalam ekosistem blockchain yang berbeza menggunakan piawaian ISO20022 yang diiktiraf secara global, yang menggantikan sistem pemesejan Swift. Ciri -ciri ini akan dicuba tidak lama lagi pada "EaseTestNet". Easeprotocolarchitectdou

Adakah masa depan untuk aplikasi mata wang digital? Appled Platform Perdagangan Mata Wang Mudah Alih Apple Muat turun TOP10 Apr 30, 2025 pm 07:00 PM

Prospek aplikasi mata wang digital adalah luas, yang secara khusus dicerminkan dalam: 1. 2. Trend pematuhan peraturan, penambahbaikan rangka kerja global dan keperluan ketat untuk AML dan KYC; 3. Kepelbagaian fungsi dan pengembangan perkhidmatan, mengintegrasikan pinjaman, pengurusan kewangan dan perkhidmatan lain dan mengoptimumkan pengalaman pengguna; 4. Pangkalan pengguna dan pengembangan global, dan skala pengguna dijangka melebihi 1 bilion pada tahun 2025.

Gagal Crypto Exchange FTX mengambil tindakan undang -undang terhadap penerbit tertentu dalam percubaan terkini Apr 30, 2025 pm 05:24 PM

Dalam percubaan terkini, FTX Crypto Exchange FTX telah mengambil tindakan undang -undang untuk memulihkan hutang dan membayar balik pelanggan. Dalam usaha terkini untuk memulihkan hutang dan membayar balik pelanggan, FTX Crypto Exchange FTX telah memfailkan tindakan undang -undang terhadap penerbit tertentu. Perdagangan FTX dan FTX Recovery Trust telah memfailkan tindakan undang -undang terhadap penerbit tertentu yang gagal memenuhi perjanjian mereka untuk mengemukakan duit syiling yang dipersetujui kepada pertukaran. Khususnya, pasukan penstrukturan semula menyaman NFTStars Limited dan Orosemi Inc. pada hari Isnin atas isu pematuhan. FTX menyaman penerbit token untuk memulihkan duit syiling yang telah tamat tempoh. FTX pernah menjadi salah satu platform perdagangan cryptocurrency yang paling cemerlang di Amerika Syarikat. Bank melaporkan pada bulan November 2022 bahawa pengasasnya Sam

Apakah tiga gergasi dalam bulatan mata wang? 10 aplikasi pertukaran utama mata wang maya yang disyorkan Apr 30, 2025 pm 06:27 PM

Dalam bulatan mata wang, yang dipanggil Big Three biasanya merujuk kepada tiga kriptografi yang paling berpengaruh dan digunakan secara meluas. Cryptocurrency ini mempunyai peranan penting dalam pasaran dan telah berfungsi dengan baik dari segi jumlah urus niaga dan permodalan pasaran. Pada masa yang sama, aplikasi pertukaran mata wang maya arus perdana juga merupakan alat penting bagi pelabur dan peniaga untuk menjalankan perdagangan cryptocurrency. Artikel ini akan memperkenalkan secara terperinci tiga gergasi dalam bulatan mata wang dan sepuluh aplikasi pertukaran mata wang maya utama yang disyorkan.

Apakah platform pertukaran yang boleh dipercayai? Pertukaran mata wang digital sepuluh teratas Apr 30, 2025 pm 04:15 PM

Pertukaran mata wang digital sepuluh digital adalah: 1. Binance, 2 Okx, 3 Coinbase, 4. Kraken, 5. Huobi Global, 6. Bitfinex, 7. Kucoin, 8 Gemini, 9. Platform ini semua menawarkan keselamatan yang tinggi dan pelbagai pilihan perdagangan, sesuai untuk keperluan pengguna yang berbeza.

AI dan Komposer: Meningkatkan Kualiti dan Pembangunan Kod May 09, 2025 am 12:20 AM

Dalam komposer, AI terutamanya meningkatkan kecekapan pembangunan dan kualiti kod melalui cadangan ketergantungan, resolusi konflik pergantungan dan peningkatan kualiti kod. 1. AI boleh mencadangkan pakej ketergantungan yang sesuai mengikut keperluan projek. 2. AI menyediakan penyelesaian pintar untuk menangani konflik pergantungan. 3. AI mengkaji kod dan menyediakan cadangan pengoptimuman untuk meningkatkan kualiti kod. Melalui fungsi ini, pemaju boleh memberi tumpuan lebih kepada pelaksanaan logik perniagaan.

See all articles