Rumah > Peranti teknologi > AI > Adakah Baidu ' s Ernie 4.5 & x1 menggantikan GPT-4.5 dan DeepSeek-R1?

Adakah Baidu ' s Ernie 4.5 & x1 menggantikan GPT-4.5 dan DeepSeek-R1?

Joseph Gordon-Levitt
Lepaskan: 2025-03-20 15:08:11
asal
241 orang telah melayarinya

China telah melakukannya sekali lagi dengan model AI dan kali ini pukulan lebih besar dan lebih baik! Baidu - sebuah syarikat AI Cina, baru -baru ini mengeluarkan dua model bahasa besar (LLMS) - Ernie 4.5 & x1. Menuntut untuk melakukan lebih baik daripada model terbaru & terbaru Openai sehingga kini-GPT-4.5, model-model ini lebih cekap daripada DeepSeek-R1! Model kelihatan terlalu baik untuk menjadi benar - menawarkan kualiti tinggi pada sebahagian kecil daripada harga. Dalam blog ini, kami akan meneroka model Ernie 4.5 & X1, menilai hasil penanda aras mereka, dan melihat bagaimana mereka melaksanakan dalam aplikasi dunia nyata. Jadi, mari kita mulakan.

Jadual Kandungan

  • Apa itu Ernie 4.5 & x1?
    • Ernie 4.5
    • Ernie X1
  • Bagaimana cara mengakses Ernie 4.5 & x1?
  • Pemeriksaan Prestasi Ernie 4.5 & X1
    • Tugas 1: Analisis Imej Penalaran
    • Tugas 2: Ringkasan Analisis Dokumen
    • Tugas 3: Analisis audio
    • Tugas 4: Generasi Imej Kreativiti
  • Ernie 4.5 & x1 Baidu: Harga
  • Ernie 4.5 & x1: Hasil penanda aras standard
  • Kesan masa depan
  • Kesimpulan
  • Soalan yang sering ditanya

Apa itu Ernie 4.5 & x1?

Ernie 4.5 & X1 adalah dua LLM multimodal terkini yang dibangunkan oleh syarikat teknologi Cina terkemuka Baidu, yang mengkhususkan diri dalam perkhidmatan internet, kecerdasan buatan, dan memandu autonomi. Ia paling terkenal dengan enjin carian dominannya di China dan kemajuan dalam inovasi AI-didorong. Baidu melancarkan LLM pertamanya, Ernie 3.0 Titan, kembali pada Disember 2021. Selepas itu, ia telah mengeluarkan beberapa model lagi, sambil bekerja secara serentak untuk membina LLM yang lebih mantap. Hasil dari semua penyelidikan dan usaha berterusan ialah Ernie 4.5 & x1.

Ernie 4.5

Ernie 4.5 adalah model asas multimodal yang mampu memahami dan mengintegrasikan pelbagai jenis data, termasuk teks, imej, audio, dan video. Pendekatan pemodelan yang pelbagai ini meningkatkan keupayaannya untuk memahami dan menghasilkan pelbagai jenis kandungan.

Berikut adalah beberapa ciri utama Ernie 4.5:

  • Ernie 4.5 menunjukkan peningkatan yang komprehensif dalam pemahaman, generasi, penalaran, dan ingatan terhadap pendahulunya, Ernie 4.0.
  • Ia menunjukkan kebolehan yang hebat dalam pencegahan halusinasi, penalaran logik, dan pengekodan, menjadikannya mahir mengendalikan tugas -tugas kompleks dengan ketepatan yang lebih tinggi. ​
  • Model ini bahkan lebih baik daripada GPT-4.5 OpenAI dalam pelbagai tanda aras, sementara ia hanya berharga 1% daripada apa yang ia kos untuk menggunakan GPT-4.5!

Ernie X1

Ernie X1 direka sebagai model pemikiran yang mendalam dengan keupayaan multimodal. Ia adalah model pemikiran yang pertama yang dikeluarkan oleh Baidu. Berikut adalah beberapa ciri utamanya:

  • Ernie X1 cemerlang dalam memahami konteks, merancang proses pemikirannya, mencerminkan tindak balasnya, dan berkembang dari masa ke masa.
  • Ia mampu menggunakan pelbagai alat untuk tugas -tugas seperti carian lanjutan, pemahaman imej, dan pengiraan yang kompleks.
  • Model ini menyampaikan prestasi setanding dengan DeepSeek-R1 tetapi pada separuh harga, menawarkan penyelesaian kos efektif untuk perusahaan yang mencari keupayaan AI maju.

Bagaimana cara mengakses Ernie 4.5 & x1?

Anda boleh mengakses Ernie 4.5 & x1 sama ada melalui chatbot AI mereka - Ernie Bot, atau melalui API.

Akses melalui Bot:

  • Kepala ke https://yiyan.baide.com .
  • Buat akaun anda dengan menambah butiran anda dan mulakan.

Kedua -dua model ini boleh diakses secara bebas kepada pengguna individu di platform BOT Baidu's Ernie. Walau bagaimanapun, pendaftaran untuk Ernie Bot kini terhad kepada warga China.

Akses melalui API:

  • Kepala ke platform Maas Baidu Ai Cloud, Qianfan
  • Buat akaun anda di platform untuk memulakan.

Pada masa ini, platform tidak dapat diakses oleh semua pengguna. Juga, hanya Ernie 4.5 yang boleh didapati melalui API, sementara Ernie X1 tidak lama lagi akan disediakan di platform.

Pemeriksaan Prestasi Ernie 4.5 & X1

Dalam bahagian ini, kami akan mengetahui bagaimana model -model ini melaksanakan tugas -tugas yang melibatkan multimedia, penalaran, analisis dokumen, dan banyak lagi. Oleh kerana antara muka model hanya menyokong bahasa Cina, dan penciptaan akaun terhad kepada warga China, kita akan melihat beberapa contoh bagaimana orang menggunakan kedua -dua model, dan output yang mereka terima. Kami akan meliputi beberapa kes penggunaan yang paling biasa dari Ernie 4.5 & x1 yang kami dapati dalam talian, termasuk:

  1. Penalaran dengan analisis imej
  2. Analisis dan ringkasan dokumen
  3. Analisis audio
  4. Kreativiti dan Generasi Imej

Tugas 1: Analisis Imej Penalaran

Dalam tugas ini, model itu diminta menyelesaikan masalah matematik yang diberikan kepadanya dalam bentuk imej.

Model yang digunakan: Ernie 4.5

Output:

Sama seperti kebanyakan LLM multimodal lain, Ernie 4.5 dengan cepat menganalisis video dan menyelesaikan masalah dalam imej. Ia mengambil semua soalan dalam imej satu demi satu, dan akhirnya meringkaskan mereka semua. Kelajuan dan ketepatan prestasinya menjadikannya alat yang berguna untuk pelajar, pendidik, penyelidik, dan profesional yang memerlukan penyelesaian masalah yang cepat dan tepat.

Tugas 2: Ringkasan Analisis Dokumen

Di sini, model itu diberi dokumen dan ia perlu meringkaskan maklumat mengenai topik tertentu dari dokumen itu.

Model yang digunakan: Ernie 4.5

Output:

Model ini membolehkan anda memuat naik pelbagai fail pelbagai jenis, sekaligus. Ia mampu memproses fail pelbagai jenis, termasuk DOCS, PDF, PPT, lembaran Excel, dan banyak lagi. Dari fail yang dimuat naik, anda boleh memilih satu (atau lebih) yang anda ingin menanyakan chatbot tentang dan model dengan cepat meringkaskan topik tersebut. Pemprosesan cepat pelbagai fail boleh sangat berguna untuk tugas -tugas seperti analisis penyelidikan, semakan dokumen undang -undang, pengekstrakan data kewangan, dan pelaporan korporat.

Tugas 3: Analisis audio

Untuk tugas ini, model itu perlu menganalisis audio yang diberikan dan mencari sumbernya.

Model yang digunakan: Ernie 4.5

Output:

Analisis audio adalah ciri yang tidak ada chatbots AI yang popular telah dimasukkan dalam antara muka mereka, menjadikan Ernie 4.5, yang pertama seumpamanya. Model ini dengan cepat menganalisis klip, menentukan sumbernya, dan kemudian terus menerangkan kepentingan klip. Analisis cepat dan penerangan terperinci, menjadikannya alat yang berharga untuk tugas-tugas seperti transkripsi masa nyata, carian berasaskan suara, pengesanan DeepFake, dan analisis sentimen di seluruh media, perkhidmatan pelanggan, pendidikan, dan penguatkuasaan undang-undang.

Tugas 4: Generasi Imej Kreativiti

Untuk tugas ini, model itu perlu menganalisis bilik dan mencadangkan hiasan yang mungkin dapat meningkatkan rayuan keseluruhannya. Ia kemudiannya perlu menghasilkan imej yang dikemas kini di bilik.

Model yang digunakan: Ernie X1

Output:

Model ini dengan cepat memproses imej. Ia kemudian mencadangkan peningkatan yang mungkin kepada hiasan bilik untuk meningkatkan rayuan keseluruhan. Akhirnya, ia menghasilkan imej bilik dengan semua peningkatan yang dicadangkan. Ciri ini merupakan tambahan yang hebat untuk tugas -tugas seperti reka bentuk dalaman, perancangan pengubahsuaian rumah, pementasan hartanah, dan visualisasi hiasan maya.

Nota: Kami telah mengambil contoh dari siaran ini pada X.

Ernie 4.5 & x1 Baidu: Harga

Kedua -dua Ernie 4.5 & X1 mempunyai semua ciri, dan lebih banyak lagi, berbanding dengan model teratas oleh Openai, Deepseek, Grok, Claude, dan lain -lain. Berikut adalah pecahan harga kedua -dua model:

Model Harga input (per juta token) Harga output (per juta token) Adanya
Ernie 4.5 $ 0.55 $ 2.20 Terdapat
Ernie X1 $ 0.28 $ 1.10 Belum ada

Berbanding dengan model teratas yang lain, Ernie 4.5 & X1 jauh lebih murah, menjadikannya aset yang berharga dalam kemajuan AI generatif.

Adakah Baidu ' s Ernie 4.5 & x1 menggantikan GPT-4.5 dan DeepSeek-R1?

Ernie 4.5 & x1: Hasil penanda aras standard

Kami telah melihat ciri -ciri, keupayaan, dan harga model Ernie terkini. Sekarang mari kita lihat beberapa nombor prestasi model-model ini terhadap model teratas seperti GPT-4.5, GPT-4O, DeepSeek-R1, dan banyak lagi.

Grafik di bawah membandingkan Ernie 4.5 dan GPT-4O merentasi pelbagai tanda aras yang menguji prestasi AI multimodal.

Adakah Baidu ' s Ernie 4.5 & x1 menggantikan GPT-4.5 dan DeepSeek-R1?

Grafik menunjukkan bahawa:

  • Ernie 4.5 mengatasi GPT-4O dalam kebanyakan tugas multimodal.
  • Skor purata untuk Ernie 4.5 ialah 77.77, yang lebih tinggi daripada GPT-4O 73.92.
  • Ernie 4.5 mempunyai kelebihan yang ketara dalam Mathvista dan Docvqa, menunjukkan penalaran matematik yang lebih baik dan kemahiran bertulis berasaskan dokumen.
  • Kedua -dua model ini sama dalam Ocrbench dan MMMU, tetapi Ernie 4.5 masih mempunyai sedikit kelebihan.

Grafik seterusnya membandingkan Ernie 4.5, DeepSeek V3-CHAT, GPT-4O, dan GPT-4.5 merentasi pelbagai tanda aras untuk penalaran berasaskan teks dan penyelesaian masalah.

Adakah Baidu ' s Ernie 4.5 & x1 menggantikan GPT-4.5 dan DeepSeek-R1?

Berikut adalah beberapa pengambilan utama dari graf:

  • Ernie 4.5 mengetuai pek dengan skor purata 79.6, dengan sempit melepasi Deepseek v3 - sembang pada 79.14.
  • Ia berfungsi dengan baik di seluruh pengetahuan umum, penalaran, dan penanda aras pengaturcaraan seperti MMLU-Pro, GSM8K, dan HumanEval.
  • GPT-4O dan DeepSeek V3 juga menunjukkan hasil yang kuat, dengan DeepSeek V3 melakukan kompetitif dalam tanda aras Cina seperti CMMLU.
  • Ernie 4.5 cemerlang dalam GSM8K (matematik) dan C-Eval (penalaran umum), walaupun DeepSeek V3 sangat dekat dengan prestasi.

Kesan masa depan

Perlumbaan menjadi LLM teratas adalah pemanasan dan Baidu's Ernie 4.5 & x1 memperkenalkan persaingan yang serius untuk Openai, Deepseek, Antropik, dan Meta. Dengan makmal AI Cina yang menyampaikan model yang menyaingi atau melepasi AI Barat dengan sebahagian kecil daripada kos, syarikat akan dipaksa untuk berinovasi lebih cepat dan menurunkan kos mereka untuk kekal berdaya saing.

Semua kemajuan ini akhirnya akan membawa kepada:

  • Kemajuan AI yang lebih cepat di semua pusat penyelidikan AI utama.
  • AI yang lebih murah untuk perniagaan dan pemaju.
  • Satu era baru aplikasi AI multimodal, berkembang melampaui AI berasaskan teks tradisional.

Kesimpulan

Model Ernie 4.5 & X1 Baidu bukan sekadar satu lagi model AI - mereka adalah pengganggu industri. Keupayaan multimodal dan penalaran mereka, harga rendah, dan integrasi mendalam ke dalam ekosistem digital China, menandakan peralihan kuasa dalam pasaran AI global.

Sekiranya trend ini berterusan, kita akan melihat pendemokrasian dan jangkauan AI skala yang lebih besar di pelbagai industri. Ini juga akan mendorong banyak syarikat Barat untuk melepaskan model yang lebih murah. Bukan sahaja ini akan menambah daya saing di pasaran, tetapi juga akan memastikan pengguna mendapat nilai paling banyak untuk wang mereka.

Soalan yang sering ditanya

Q1. Apa itu Ernie 4.5 & x1?

A. Ernie 4.5 & X1 adalah model bahasa besar terkini (LLMS) yang dibangunkan oleh Baidu, yang direka untuk menyaingi model AI seperti OpenAI's GPT-4.5 dan DeepSeek-R1. Ernie 4.5 adalah model asas multimodal, sementara Ernie X1 adalah model pemikiran yang mendalam dengan keupayaan maju.

S2. Bagaimana Baidu's Ernie 4.5 berbeza dari Ernie X1?

A. Ernie 4.5 dioptimumkan untuk pemahaman multimodal, mampu memproses teks, imej, audio, dan video dengan ketepatan yang tinggi. Ernie X1, sebaliknya, direka untuk pemikiran yang mendalam, cemerlang dalam pemahaman konteks, perancangan, dan penyelesaian masalah dengan refleksi diri.

Q3. Bagaimanakah Ernie 4.5 & x1 membandingkan dengan GPT-4.5 OpenAI?

A. Baidu Ernie 4.5 mengatasi GPT-4.5 dalam pelbagai tanda aras, terutamanya dalam penalaran, pemahaman multimodal, dan pencegahan halusinasi, sementara hanya berharga 1% daripada harga GPT-4.5. Ernie X1 menyampaikan prestasi peringkat DeepSeek-R1 pada separuh kos, menjadikannya penyelesaian AI yang sangat kompetitif.

Q4. Apakah butiran harga untuk Ernie 4.5 & x1?

A. Ernie 4.5: Kos input $ 0.55 setiap token 1m, kos output $ 2.20 per 1m token.
Ernie X1: Kos input $ 0.28 setiap token 1m, kos output $ 1.10 per 1m token.
Model Ernie X1 belum tersedia melalui API tetapi akan segera.

S5. Bagaimana saya boleh mengakses Ernie 4.5 & x1?

A. Anda boleh mengakses model ini melalui:
1. Ernie Bot (AI Chatbot) di yiyan.baide.com (hanya tersedia untuk pengguna Cina).
2. Platform Maas Baidu Ai Cloud, Qianfan, untuk akses API (kini hanya Ernie 4.5 yang tersedia).

Atas ialah kandungan terperinci Adakah Baidu ' s Ernie 4.5 & x1 menggantikan GPT-4.5 dan DeepSeek-R1?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan Laman Web ini
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn
Tutorial Popular
Lagi>
Muat turun terkini
Lagi>
kesan web
Kod sumber laman web
Bahan laman web
Templat hujung hadapan