China telah melakukannya sekali lagi dengan model AI dan kali ini pukulan lebih besar dan lebih baik! Baidu - sebuah syarikat AI Cina, baru -baru ini mengeluarkan dua model bahasa besar (LLMS) - Ernie 4.5 & x1. Menuntut untuk melakukan lebih baik daripada model terbaru & terbaru Openai sehingga kini-GPT-4.5, model-model ini lebih cekap daripada DeepSeek-R1! Model kelihatan terlalu baik untuk menjadi benar - menawarkan kualiti tinggi pada sebahagian kecil daripada harga. Dalam blog ini, kami akan meneroka model Ernie 4.5 & X1, menilai hasil penanda aras mereka, dan melihat bagaimana mereka melaksanakan dalam aplikasi dunia nyata. Jadi, mari kita mulakan.
Ernie 4.5 & X1 adalah dua LLM multimodal terkini yang dibangunkan oleh syarikat teknologi Cina terkemuka Baidu, yang mengkhususkan diri dalam perkhidmatan internet, kecerdasan buatan, dan memandu autonomi. Ia paling terkenal dengan enjin carian dominannya di China dan kemajuan dalam inovasi AI-didorong. Baidu melancarkan LLM pertamanya, Ernie 3.0 Titan, kembali pada Disember 2021. Selepas itu, ia telah mengeluarkan beberapa model lagi, sambil bekerja secara serentak untuk membina LLM yang lebih mantap. Hasil dari semua penyelidikan dan usaha berterusan ialah Ernie 4.5 & x1.
Ernie 4.5 adalah model asas multimodal yang mampu memahami dan mengintegrasikan pelbagai jenis data, termasuk teks, imej, audio, dan video. Pendekatan pemodelan yang pelbagai ini meningkatkan keupayaannya untuk memahami dan menghasilkan pelbagai jenis kandungan.
Berikut adalah beberapa ciri utama Ernie 4.5:
Ernie X1 direka sebagai model pemikiran yang mendalam dengan keupayaan multimodal. Ia adalah model pemikiran yang pertama yang dikeluarkan oleh Baidu. Berikut adalah beberapa ciri utamanya:
Anda boleh mengakses Ernie 4.5 & x1 sama ada melalui chatbot AI mereka - Ernie Bot, atau melalui API.
Akses melalui Bot:
Kedua -dua model ini boleh diakses secara bebas kepada pengguna individu di platform BOT Baidu's Ernie. Walau bagaimanapun, pendaftaran untuk Ernie Bot kini terhad kepada warga China.
Akses melalui API:
Pada masa ini, platform tidak dapat diakses oleh semua pengguna. Juga, hanya Ernie 4.5 yang boleh didapati melalui API, sementara Ernie X1 tidak lama lagi akan disediakan di platform.
Dalam bahagian ini, kami akan mengetahui bagaimana model -model ini melaksanakan tugas -tugas yang melibatkan multimedia, penalaran, analisis dokumen, dan banyak lagi. Oleh kerana antara muka model hanya menyokong bahasa Cina, dan penciptaan akaun terhad kepada warga China, kita akan melihat beberapa contoh bagaimana orang menggunakan kedua -dua model, dan output yang mereka terima. Kami akan meliputi beberapa kes penggunaan yang paling biasa dari Ernie 4.5 & x1 yang kami dapati dalam talian, termasuk:
Dalam tugas ini, model itu diminta menyelesaikan masalah matematik yang diberikan kepadanya dalam bentuk imej.
Model yang digunakan: Ernie 4.5
Output:
Sama seperti kebanyakan LLM multimodal lain, Ernie 4.5 dengan cepat menganalisis video dan menyelesaikan masalah dalam imej. Ia mengambil semua soalan dalam imej satu demi satu, dan akhirnya meringkaskan mereka semua. Kelajuan dan ketepatan prestasinya menjadikannya alat yang berguna untuk pelajar, pendidik, penyelidik, dan profesional yang memerlukan penyelesaian masalah yang cepat dan tepat.
Di sini, model itu diberi dokumen dan ia perlu meringkaskan maklumat mengenai topik tertentu dari dokumen itu.
Model yang digunakan: Ernie 4.5
Output:
Model ini membolehkan anda memuat naik pelbagai fail pelbagai jenis, sekaligus. Ia mampu memproses fail pelbagai jenis, termasuk DOCS, PDF, PPT, lembaran Excel, dan banyak lagi. Dari fail yang dimuat naik, anda boleh memilih satu (atau lebih) yang anda ingin menanyakan chatbot tentang dan model dengan cepat meringkaskan topik tersebut. Pemprosesan cepat pelbagai fail boleh sangat berguna untuk tugas -tugas seperti analisis penyelidikan, semakan dokumen undang -undang, pengekstrakan data kewangan, dan pelaporan korporat.
Untuk tugas ini, model itu perlu menganalisis audio yang diberikan dan mencari sumbernya.
Model yang digunakan: Ernie 4.5
Output:
Analisis audio adalah ciri yang tidak ada chatbots AI yang popular telah dimasukkan dalam antara muka mereka, menjadikan Ernie 4.5, yang pertama seumpamanya. Model ini dengan cepat menganalisis klip, menentukan sumbernya, dan kemudian terus menerangkan kepentingan klip. Analisis cepat dan penerangan terperinci, menjadikannya alat yang berharga untuk tugas-tugas seperti transkripsi masa nyata, carian berasaskan suara, pengesanan DeepFake, dan analisis sentimen di seluruh media, perkhidmatan pelanggan, pendidikan, dan penguatkuasaan undang-undang.
Untuk tugas ini, model itu perlu menganalisis bilik dan mencadangkan hiasan yang mungkin dapat meningkatkan rayuan keseluruhannya. Ia kemudiannya perlu menghasilkan imej yang dikemas kini di bilik.
Model yang digunakan: Ernie X1
Output:
Model ini dengan cepat memproses imej. Ia kemudian mencadangkan peningkatan yang mungkin kepada hiasan bilik untuk meningkatkan rayuan keseluruhan. Akhirnya, ia menghasilkan imej bilik dengan semua peningkatan yang dicadangkan. Ciri ini merupakan tambahan yang hebat untuk tugas -tugas seperti reka bentuk dalaman, perancangan pengubahsuaian rumah, pementasan hartanah, dan visualisasi hiasan maya.
Nota: Kami telah mengambil contoh dari siaran ini pada X.
Kedua -dua Ernie 4.5 & X1 mempunyai semua ciri, dan lebih banyak lagi, berbanding dengan model teratas oleh Openai, Deepseek, Grok, Claude, dan lain -lain. Berikut adalah pecahan harga kedua -dua model:
Model | Harga input (per juta token) | Harga output (per juta token) | Adanya |
Ernie 4.5 | $ 0.55 | $ 2.20 | Terdapat |
Ernie X1 | $ 0.28 | $ 1.10 | Belum ada |
Berbanding dengan model teratas yang lain, Ernie 4.5 & X1 jauh lebih murah, menjadikannya aset yang berharga dalam kemajuan AI generatif.
Kami telah melihat ciri -ciri, keupayaan, dan harga model Ernie terkini. Sekarang mari kita lihat beberapa nombor prestasi model-model ini terhadap model teratas seperti GPT-4.5, GPT-4O, DeepSeek-R1, dan banyak lagi.
Grafik di bawah membandingkan Ernie 4.5 dan GPT-4O merentasi pelbagai tanda aras yang menguji prestasi AI multimodal.
Grafik menunjukkan bahawa:
Grafik seterusnya membandingkan Ernie 4.5, DeepSeek V3-CHAT, GPT-4O, dan GPT-4.5 merentasi pelbagai tanda aras untuk penalaran berasaskan teks dan penyelesaian masalah.
Berikut adalah beberapa pengambilan utama dari graf:
Perlumbaan menjadi LLM teratas adalah pemanasan dan Baidu's Ernie 4.5 & x1 memperkenalkan persaingan yang serius untuk Openai, Deepseek, Antropik, dan Meta. Dengan makmal AI Cina yang menyampaikan model yang menyaingi atau melepasi AI Barat dengan sebahagian kecil daripada kos, syarikat akan dipaksa untuk berinovasi lebih cepat dan menurunkan kos mereka untuk kekal berdaya saing.
Semua kemajuan ini akhirnya akan membawa kepada:
Model Ernie 4.5 & X1 Baidu bukan sekadar satu lagi model AI - mereka adalah pengganggu industri. Keupayaan multimodal dan penalaran mereka, harga rendah, dan integrasi mendalam ke dalam ekosistem digital China, menandakan peralihan kuasa dalam pasaran AI global.
Sekiranya trend ini berterusan, kita akan melihat pendemokrasian dan jangkauan AI skala yang lebih besar di pelbagai industri. Ini juga akan mendorong banyak syarikat Barat untuk melepaskan model yang lebih murah. Bukan sahaja ini akan menambah daya saing di pasaran, tetapi juga akan memastikan pengguna mendapat nilai paling banyak untuk wang mereka.
A. Ernie 4.5 & X1 adalah model bahasa besar terkini (LLMS) yang dibangunkan oleh Baidu, yang direka untuk menyaingi model AI seperti OpenAI's GPT-4.5 dan DeepSeek-R1. Ernie 4.5 adalah model asas multimodal, sementara Ernie X1 adalah model pemikiran yang mendalam dengan keupayaan maju.
S2. Bagaimana Baidu's Ernie 4.5 berbeza dari Ernie X1?A. Ernie 4.5 dioptimumkan untuk pemahaman multimodal, mampu memproses teks, imej, audio, dan video dengan ketepatan yang tinggi. Ernie X1, sebaliknya, direka untuk pemikiran yang mendalam, cemerlang dalam pemahaman konteks, perancangan, dan penyelesaian masalah dengan refleksi diri.
Q3. Bagaimanakah Ernie 4.5 & x1 membandingkan dengan GPT-4.5 OpenAI?A. Baidu Ernie 4.5 mengatasi GPT-4.5 dalam pelbagai tanda aras, terutamanya dalam penalaran, pemahaman multimodal, dan pencegahan halusinasi, sementara hanya berharga 1% daripada harga GPT-4.5. Ernie X1 menyampaikan prestasi peringkat DeepSeek-R1 pada separuh kos, menjadikannya penyelesaian AI yang sangat kompetitif.
Q4. Apakah butiran harga untuk Ernie 4.5 & x1? A. Ernie 4.5: Kos input $ 0.55 setiap token 1m, kos output $ 2.20 per 1m token.
Ernie X1: Kos input $ 0.28 setiap token 1m, kos output $ 1.10 per 1m token.
Model Ernie X1 belum tersedia melalui API tetapi akan segera.
A. Anda boleh mengakses model ini melalui:
1. Ernie Bot (AI Chatbot) di yiyan.baide.com (hanya tersedia untuk pengguna Cina).
2. Platform Maas Baidu Ai Cloud, Qianfan, untuk akses API (kini hanya Ernie 4.5 yang tersedia).
Atas ialah kandungan terperinci Adakah Baidu ' s Ernie 4.5 & x1 menggantikan GPT-4.5 dan DeepSeek-R1?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!