O1対GPT-4O：OpenAIの新しいモデルはGPT-4Oよりも優れていますか？-AI-php.cn

O1対GPT-4O：OpenAIの新しいモデルはGPT-4Oよりも優れていますか？

尊渡假赌尊渡假赌尊渡假赌

リリース： 2025-03-16 11:47:10

オリジナル

346 人が閲覧しました

OpenaiのO1：12日間の贈り物は、これまでで最も強力なモデルから始まります

12月の到着は、世界の一部の地域で雪片が世界的に減速し、雪片がもたらされますが、Openaiは始まったばかりです。 Sam Altmanと彼のチームは12日間のギフトExtravaganzaを立ち上げています。最初のプレゼントは、これまでで最も先進的なモデルであるOpenai O1です。数ヶ月間、GPT-4は最高の統治をしてきましたが、O1はその支配に挑戦するためにここにいます。このブログは、いくつかのタスクでGPT-4Oに対してO1をピットして、優れたモデルを決定します。

Openai O1：何が新しいですか？
O1へのアクセス
O1対GPT-4O：課題
- タスク1：感情分析のためのフローチャート設計
- タスク2：科学的画像分析
- タスク3：数学的画像分析
- タスク4：Sudokuソリューション
- タスク5：画像生成
結果：O1対GPT-4O
結論

Openai O1：重要な改善

2024年9月のO1-Previewモデルに基づいて、OpenaiのO1は、複雑なタスクの精度と速度の向上を提供します。その前身と比較して：

O1は、タスクの難易度とともに適切に処理時間をスケーリングすることで、より単純な問題についてより簡潔な推論を示します。
Openaiは、数学的推論とコーディングの大幅なパフォーマンスの向上を報告しています。
O1は、テキストのみのO1-Previewとは異なり、マルチモーダル機能（テキスト、画像、オーディオ）を誇っています。

O1へのアクセス

O1は、ChatGpt PlusおよびChatGpt Proサブスクリプション（無料プランではありません）を介して利用できます。 ChatGpt Proは無制限のO1アクセスを提供し、Plusは限られた数のインタラクションを提供します。アクセスするには：

chatgpt pro/plusアカウントにログインします。
モデル選択メニュー（左上）から目的のモデルを選択します。

O1対GPT-4O：OpenAIの新しいモデルはGPT-4Oよりも優れていますか？

O1対GPT-4O：頭と頭の比較

O1-Previewは感銘を受けましたが、GPT-4O（2024年5月に発売）は、テキスト、画像、オーディオの取り扱いにおける精度、速度、汎用性の最大の選択肢のままでした。 88.7％のMMLUベンチマークスコアは、マルチモーダルAIのハイバーを設定しました。 O1は現在、特に数学、コーディング、複雑な問題解決において、GPT-4oを上回ることを目指しています。 5つの課題が勝者を明らかにします：

問題を理解し、フローチャートを作成します。
科学的画像分析。
数学的画像分析。
数独パズルの解決。
画像生成。

チャレンジ1：感情分析のためのフローチャート設計

プロンプト：フローチャートを設計し、ストックニュース（ニュースAPI）を取得し、センチメントを分析し、140文字の概要と感情を顧客に提供するセンチメント分析システムに必要なツールを説明します。

結果： O1は、追加のツールの詳細な説明と提案を含む、明確でエラーのないフローチャートを作成しました。 GPT-4oは、概念的な説明と欠陥のある図を提供しました。

評決： O1が勝ちます。

チャレンジ2：科学的画像分析

プロンプト：この回路図の出力を計算します。 （提供された回路図の画像）

結果： O1コンポーネントを正しく識別し、グラフから値を読み取り、回路操作を記述し、計算されたパラメーターを計算しました。 GPT-4oはいくつかのコンポーネントを特定しましたが、追加の入力値が必要でした。

評決： O1が勝ちます。

チャレンジ3：数学的画像分析

プロンプト：このゲームの各チームの勝利確率を決定します。 （提供されたクリケットスコアボードの画像）

結果： O1は画像を正確に分析し、ゲーム形式を識別し、正当化を伴うWIN確率を計算しました。 GPT-4oはゲームを部分的に理解しましたが、確率を提供できませんでした。

評決： O1が勝ちます。

チャレンジ4：Sudokuソリューション

プロンプト：この数独パズルを解決し、ソリューションを画像として提供します。 （Sudoku Puzzleが提供する画像）

結果：両方のモデルが正しいソリューションを提供できませんでした。

評決：ネクタイ（両方とも失敗）。

チャレンジ5：画像生成

プロンプト：海岸近くで走っている犬の画像を作成します。

結果： GPT-4oは要求された画像を生成しました。 O1には現在、画像生成機能がありません。

評決： GPT-4Oが勝ちます。

結果の概要：O1対GPT-4O

チャレンジ	GPT-4O結果	O1結果	評決
フローチャートデザイン	概念的で不明確なエラー	クリア、詳細、エラーなし	O1
科学的画像分析	部分コンポーネントの識別、不完全	完全な分析、正確な計算	O1
数学的画像分析	部分的な理解、確率が与えられません	正確な分析、計算された確率	O1
Sudokuソリューション	正しくない	正しくない	ネクタイ
画像生成	生成された正しい画像	画像を生成できません	GPT-4O

結論

O1は多くの領域でGPT-4Oを大幅に上回り、優れた推論と精度を示しています。その速度と簡潔さは、O1-Previewよりも注目に値する改善もあります。ただし、それは完璧ではなく、反復的な改良が必要になる場合があります。 O1は、高度な問題解決能力を必要とする研究者、科学者、専門家にとって強力なツールです。

よくある質問