ホームページ > テクノロジー周辺機器 > AI > Baidu' s Ernie 4.5&x1はGPT-4.5とDeepSeek-R1を置き換えますか?

Baidu' s Ernie 4.5&x1はGPT-4.5とDeepSeek-R1を置き換えますか?

Joseph Gordon-Levitt
リリース: 2025-03-20 15:08:11
オリジナル
248 人が閲覧しました

中国はAIモデルで再びそれをやりましたが、今回は打撃がより大きく、より良いです! Baidu - 中国のAI会社は、最近2つの大手言語モデル(LLMS)をリリースしました - アーニー4.5&X1。これまでのOpenaiの最新かつ最大のモデルよりも優れたパフォーマンスを主張するGPT-4.5では、これらのモデルはDeepSeek-R1よりも費用効率が高いです。モデルはあまりにも良いように見えます - 価格のほんの一部で高品質を提供します。このブログでは、アーニー4.5&X1モデルを調査し、ベンチマークの結果を評価し、それらが実際のアプリケーションでどのように機能するかを確認します。それでは、始めましょう。

目次

  • アーニー4.5とx1とは何ですか?
    • アーニー4.5
    • アーニーX1
  • アーニー4.5とx1にアクセスする方法は?
  • アーニー4.5およびX1パフォーマンスチェック
    • タスク1:推論画像分析
    • タスク2:ドキュメント分析の要約
    • タスク3:オーディオ分析
    • タスク4:創造性の画像生成
  • Baiduのアーニー4.5&X1:価格
  • アーニー4.5およびX1:標準ベンチマークの結果
  • 将来の影響
  • 結論
  • よくある質問

アーニー4.5とx1とは何ですか?

Ernie 4.5&X1は、インターネットサービス、人工知能、自律運転を専門とする中国の大手技術会社Baiduが開発した2つの最新のマルチモーダルLLMです。中国での支配的な検索エンジンと、AI主導のイノベーションの進歩で最もよく知られています。 Baiduは、2021年12月に最初のLLMであるErnie 3.0 Titanを発売しました。その後、さらにいくつかのモデルをリリースし、より堅牢なLLMを構築するために同時に作業しました。すべての研究と継続的な努力の結果は、アーニー4.5とX1です。

アーニー4.5

Ernie 4.5は、テキスト、画像、オーディオ、ビデオなど、さまざまなデータタイプを理解し統合できるマルチモーダルファンデーションモデルです。この多様なモデリングアプローチは、さまざまな種類のコンテンツを理解して生成する能力を高めます。

アーニー4.5の重要な機能の一部を次に示します。

  • アーニー4.5は、その前身であるアーニー4.0に対する理解、生成、推論、および記憶の包括的な改善を示しています。
  • 幻覚防止、論理的推論、コーディングに大きな能力を示し、より高い精度で複雑なタスクの取り扱いに熟達しています。 ​
  • このモデルは、複数のベンチマークでOpenaiのGPT-4.5よりも優れたパフォーマンスもありますが、GPT-4.5を使用するのにかかる費用の1%しかかかりません。

アーニーX1

Ernie X1は、マルチモーダル機能を備えた深い考えの推論モデルとして設計されています。これは、Baiduがリリースしたこの種のディープ思考モデルの最初です。主要な機能のいくつかは次のとおりです。

  • アーニーX1は、コンテキストを理解し、その思考プロセスを計画し、その反応を反映し、時間の経過とともに進化することに優れています。
  • 高度な検索、画像理解、複雑な計算などのタスクにさまざまなツールを自律的に利用できます。
  • このモデルは、DeepSeek-R1と同等のパフォーマンスを提供しますが、半分の価格で、高度なAI機能を求めている企業に費用対効果の高いソリューションを提供します。

アーニー4.5とx1にアクセスする方法は?

AIチャットボット - アーニーボット、またはAPIを介して、アーニー4.5とX1にアクセスできます。

ボット経由のアクセス:

  • https://yiyan.baidu.comに向かいます
  • 詳細を追加してアカウントを作成し、開始します。

どちらのモデルも、BaiduのErnie Botプラットフォームで個々のユーザーが自由にアクセスできます。ただし、アーニーボットの登録は現在、中国国民に限定されています。

API経由のアクセス:

  • QianfanのBaidu Ai CloudのMaasプラットフォームに向かいます
  • プラットフォームでアカウントを作成して、開始します。

現在、プラットフォームにはすべてのユーザーがアクセスすることはできません。また、APIを介して利用可能なのはArnie 4.5のみであり、Arnie X1はまもなくプラットフォームで利用可能になります。

アーニー4.5およびX1パフォーマンスチェック

このセクションでは、これらのモデルがマルチメディア、推論、ドキュメント分析などを含むタスクでどのように機能するかを確認します。モデルインターフェイスは中国語のみをサポートしており、アカウントの作成は中国国民に限定されているため、2つのモデルをどのように使用しているか、および受け取った出力の例をいくつか見ていきます。以下を含む、オンラインで見つけたアーニー4.5とX1の最も一般的なユースケースのいくつかをカバーします。

  1. 画像分析による推論
  2. ドキュメント分析と要約
  3. オーディオ分析
  4. 創造性とイメージ生成

タスク1:推論画像分析

このタスクでは、モデルは画像の形で与えられた数学的問題を解決するように求められました。

使用されるモデル:アーニー4.5

出力:

他のほとんどのマルチモーダルLLMSと同様に、アーニー4.5はビデオをすばやく分析し、画像の問題を解決します。画像のすべての質問を1つずつ受け取り、最終的にそれらすべてを要約します。パフォーマンスの速度と正確性により、迅速かつ正確な問題解決を必要とする学生、教育者、研究者、専門家にとって有用なツールになります。

タスク2:ドキュメント分析の要約

ここでは、モデルにドキュメントが与えられ、そのドキュメントから特定のトピックに関する情報を要約する必要がありました。

使用されるモデル:アーニー4.5

出力:

このモデルを使用すると、さまざまなタイプの複数のファイルを一度にアップロードできます。ドキュメント、PDF、PPTS、Excelシートなど、さまざまなタイプのファイルを処理できます。アップロードされたファイルから、チャットボットについて照会したいファイル(またはそれ以上)を選択でき、モデルはトピックをすばやく要約します。複数のファイルの迅速な処理は、研究分析、法的文書レビュー、財務データ抽出、企業報告などのタスクに非常に役立ちます。

タスク3:オーディオ分析

このタスクでは、モデルは指定されたオーディオを分析し、そのソースを見つける必要がありました。

使用されるモデル:アーニー4.5

出力:

オーディオ分析は、人気のあるAIチャットボットがインターフェイスに組み込まれていない機能であり、この種のアーニー4.5を作る機能です。モデルはクリップを迅速に分析し、そのソースを決定し、クリップの重要性を説明し続けます。その迅速な分析と詳細な説明により、リアルタイムの転写、音声ベースの検索、ディープフェイク検出、メディア、顧客サービス、教育、法執行機関全体の感情分析などのタスクの貴重なツールになります。

タスク4:創造性の画像生成

このタスクのために、モデルは部屋を分析し、全体的な魅力を高めることができる可能性のある装飾を提案する必要がありました。その後、部屋の更新された画像を生成する必要がありました。

使用されるモデル:アーニーX1

出力:

モデルはすぐに画像を処理します。次に、全体的な魅力を高めるために、部屋の装飾の改善の可能性を示唆しています。最後に、すべての提案された機能強化を備えた部屋の画像を生成します。この機能は、インテリアデザイン、家の改修計画、不動産のステージング、仮想装飾の視覚化などのタスクに最適な追加です。

注:この投稿からXの例を挙げました。

Baiduのアーニー4.5&X1:価格

Ernie 4.5とX1の両方に、Openai、Deepseek、Grok、Claudeなどのトップモデルと比較して、すべての機能があります。ここに2つのモデルの価格の内訳があります。

モデル 入力価格(100万トークンあたり) 出力価格(100万トークンあたり) 可用性
アーニー4.5 0.55ドル 2.20ドル 利用可能
アーニーX1 0.28ドル $ 1.10 まだ利用できません

他のトップモデルと比較して、アーニー4.5とX1は大幅に安価であり、生成AIの進歩における貴重な資産となっています。

Baidu' s Ernie 4.5&x1はGPT-4.5とDeepSeek-R1を置き換えますか?

アーニー4.5およびX1:標準ベンチマークの結果

最新のアーニーモデルの機能、能力、価格設定をすでに見てきました。次に、GPT-4.5、GPT-4O、DeepSeek-R1などのトップモデルに対するこれらのモデルのパフォーマンス数を見てみましょう。

以下のグラフは、マルチモーダルAIパフォーマンスをテストする複数のベンチマークにわたって、アーニー4.5とGPT-4Oを比較しています。

Baidu' s Ernie 4.5&x1はGPT-4.5とDeepSeek-R1を置き換えますか?

グラフは次のことを示しています:

  • アーニー4.5は、ほとんどのマルチモーダルタスクでGPT-4Oを上回ります。
  • アーニー4.5の平均スコアは77.77で、GPT-4Oの73.92よりも高くなっています。
  • アーニー4.5は、MathvistaとDocvqaに大きな優位性を持ち、数学の推論とドキュメントベースの質問を回答するスキルを示しています。
  • どちらのモデルもOcrbenchとMmmuで同様に機能しますが、アーニー4.5にはまだわずかな利点があります。

次のグラフでは、テキストベースの推論と問題解決のために、複数のベンチマークでArnie 4.5、Deepseek V3 - Chat、GPT-4O、およびGPT-4.5を比較します。

Baidu' s Ernie 4.5&x1はGPT-4.5とDeepSeek-R1を置き換えますか?

グラフからの重要なポイントを次に示します。

  • Ernie 4.5は、平均スコア79.6でパックをリードし、Deepseek V3をわずかに上回る79.14でチャットします。
  • MMLU-Pro、GSM8K、Humanvalなどの一般的な知識、推論、およびプログラミングベンチマークでうまく機能します。
  • GPT-4OとDeepSeek V3も強力な結果を示しており、DeepSeek V3はCMMLUのような中国のベンチマークで競争力のあるパフォーマンスを発揮しています。
  • Ernie 4.5はGSM8K(MATH)およびC-EVAL(一般的な推論)に優れていますが、DeepSeek V3はパフォーマンスが非常に近いです。

将来の影響

トップLLMになるレースは熱くなり、バイドゥのアーニー4.5とX1は、オープン、ディープシーク、人類、メタの深刻な競争を導入しています。中国のAI Labsが西部AIに匹敵するモデルを数分の1のコストで提供するモデルを提供することで、企業は競争力を維持するためにより速く革新し、コストを削減することを余儀なくされます。

これらの進歩はすべて、ついに次のようになります。

  • すべての主要なAI研究センターでAIがより速く進歩しています。
  • 企業や開発者向けのより手頃なAI。
  • 従来のテキストベースのAIを超えて拡大するマルチモーダルAIアプリケーションの新しい時代。

結論

BaiduのErnie 4.5およびX1モデルは、AIモデルの単なるセットではなく、業界の破壊者です。彼らの優れたマルチモーダルおよび推論能力、低価格、および中国のデジタルエコシステムへの深い統合は、グローバルAI市場のパワーシフトを示しています。

この傾向が続くと、さまざまな業界で大規模なAI民主化とアウトリーチが見られます。これにより、多くの西洋企業がより安価なモデルをリリースするようになります。これは市場での競争力を高めるだけでなく、ユーザーが自分のお金に最も価値を獲得することも保証します。

よくある質問

Q1。アーニー4.5とx1とは何ですか?

A. Ernie 4.5&X1は、Baiduが開発した最新の大型言語モデル(LLMS)であり、OpenaiのGPT-4.5やDeepseek-R1などのトップAIモデルに匹敵するように設計されています。アーニー4.5はマルチモーダルファンデーションモデルですが、アーニーX1は高度な機能を備えた深い考えの推論モデルです。

Q2。バイドゥのアーニー4.5はアーニーX1とどう違うのですか?

A.アーニー4.5は、テキスト、画像、オーディオ、ビデオを高い精度で処理できるマルチモーダル理解のために最適化されています。一方、アーニーX1は、深い考えの推論のために設計されており、文脈の理解、計画、および自己反射を伴う問題解決に優れています。

Q3。 Ernie 4.5とX1は、OpenaiのGPT-4.5と比較してどうですか?

A. Baidu Ernie 4.5は、特に推論、マルチモーダル理解、および幻覚防止で、複数のベンチマークでGPT-4.5を上回り、GPT-4.5の価格の1%しかかかりません。 Ernie X1は、DeepSeek-R1レベルのパフォーマンスを半分のコストで提供し、非常に競争力のあるAIソリューションを提供します。

Q4。アーニー4.5とX1の価格の詳細は何ですか?

A.アーニー4.5:入力コストは100万トークンあたり0.55ドル、出力は100万トークンあたり2.20ドルでした。
Ernie X1:入力コストは100万トークンあたり0.28ドル、出力は100万トークンあたり1.10ドルでした。
Ernie X1モデルはまだAPIを介して利用できませんが、まもなく利用できます。

Q5。アーニー4.5とx1にアクセスするにはどうすればよいですか?

A.これらのモデルにアクセスできます。
1。Yiyan.Baidu.comのErnie Bot(AI Chatbot)(中国のユーザーのみが利用できます)。
2。BaiduAI CloudのMaasプラットフォーム、Qianfan、APIアクセス用(現在はErnie 4.5のみが利用可能です)。

以上がBaidu' s Ernie 4.5&x1はGPT-4.5とDeepSeek-R1を置き換えますか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。
人気のチュートリアル
詳細>
最新のダウンロード
詳細>
ウェブエフェクト
公式サイト
サイト素材
フロントエンドテンプレート