OpenaiのO1:12日間の贈り物は、これまでで最も強力なモデルから始まります
12月の到着は、世界の一部の地域で雪片が世界的に減速し、雪片がもたらされますが、Openaiは始まったばかりです。 Sam Altmanと彼のチームは12日間のギフトExtravaganzaを立ち上げています。最初のプレゼントは、これまでで最も先進的なモデルであるOpenai O1です。数ヶ月間、GPT-4は最高の統治をしてきましたが、O1はその支配に挑戦するためにここにいます。このブログは、いくつかのタスクでGPT-4Oに対してO1をピットして、優れたモデルを決定します。
目次
Openai O1:重要な改善
2024年9月のO1-Previewモデルに基づいて、OpenaiのO1は、複雑なタスクの精度と速度の向上を提供します。その前身と比較して:
O1へのアクセス
O1は、ChatGpt PlusおよびChatGpt Proサブスクリプション(無料プランではありません)を介して利用できます。 ChatGpt Proは無制限のO1アクセスを提供し、Plusは限られた数のインタラクションを提供します。アクセスするには:
O1対GPT-4O:頭と頭の比較
O1-Previewは感銘を受けましたが、GPT-4O(2024年5月に発売)は、テキスト、画像、オーディオの取り扱いにおける精度、速度、汎用性の最大の選択肢のままでした。 88.7%のMMLUベンチマークスコアは、マルチモーダルAIのハイバーを設定しました。 O1は現在、特に数学、コーディング、複雑な問題解決において、GPT-4oを上回ることを目指しています。 5つの課題が勝者を明らかにします:
チャレンジ1:感情分析のためのフローチャート設計
プロンプト:フローチャートを設計し、ストックニュース(ニュースAPI)を取得し、センチメントを分析し、140文字の概要と感情を顧客に提供するセンチメント分析システムに必要なツールを説明します。
結果: O1は、追加のツールの詳細な説明と提案を含む、明確でエラーのないフローチャートを作成しました。 GPT-4oは、概念的な説明と欠陥のある図を提供しました。
評決: O1が勝ちます。
チャレンジ2:科学的画像分析
プロンプト:この回路図の出力を計算します。 (提供された回路図の画像)
結果: O1コンポーネントを正しく識別し、グラフから値を読み取り、回路操作を記述し、計算されたパラメーターを計算しました。 GPT-4oはいくつかのコンポーネントを特定しましたが、追加の入力値が必要でした。
評決: O1が勝ちます。
チャレンジ3:数学的画像分析
プロンプト:このゲームの各チームの勝利確率を決定します。 (提供されたクリケットスコアボードの画像)
結果: O1は画像を正確に分析し、ゲーム形式を識別し、正当化を伴うWIN確率を計算しました。 GPT-4oはゲームを部分的に理解しましたが、確率を提供できませんでした。
評決: O1が勝ちます。
チャレンジ4:Sudokuソリューション
プロンプト:この数独パズルを解決し、ソリューションを画像として提供します。 (Sudoku Puzzleが提供する画像)
結果:両方のモデルが正しいソリューションを提供できませんでした。
評決:ネクタイ(両方とも失敗)。
チャレンジ5:画像生成
プロンプト:海岸近くで走っている犬の画像を作成します。
結果: GPT-4oは要求された画像を生成しました。 O1には現在、画像生成機能がありません。
評決: GPT-4Oが勝ちます。
結果の概要:O1対GPT-4O
チャレンジ | GPT-4O結果 | O1結果 | 評決 |
---|---|---|---|
フローチャートデザイン | 概念的で不明確なエラー | クリア、詳細、エラーなし | O1 |
科学的画像分析 | 部分コンポーネントの識別、不完全 | 完全な分析、正確な計算 | O1 |
数学的画像分析 | 部分的な理解、確率が与えられません | 正確な分析、計算された確率 | O1 |
Sudokuソリューション | 正しくない | 正しくない | ネクタイ |
画像生成 | 生成された正しい画像 | 画像を生成できません | GPT-4O |
結論
O1は多くの領域でGPT-4Oを大幅に上回り、優れた推論と精度を示しています。その速度と簡潔さは、O1-Previewよりも注目に値する改善もあります。ただし、それは完璧ではなく、反復的な改良が必要になる場合があります。 O1は、高度な問題解決能力を必要とする研究者、科学者、専門家にとって強力なツールです。
よくある質問
以上がO1対GPT-4O:OpenAIの新しいモデルはGPT-4Oよりも優れていますか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。