公開されたばかりの Claude3 は OpenAI の最大の弱点を直接攻撃します

PHPz
リリース: 2024-03-10 08:07:25
転載
1025 人が閲覧しました

エンタープライズ レベルの SOTA 大規模モデル、Anthropic の Claude3 はどのようなシグナルをリリースしますか?

著者 | Wan Chen

編集者 | Jingyu

は、OpenAI GPT3 の責任者としての起業家プロジェクトです。研究開発部門の Anthropic は、OpenAI と最も競合できるスタートアップとみなされています。

Anthropic は、現地時間月曜日に一連の大型 Claude 3 シリーズ モデルをリリースし、同社の最も強力なモデルがさまざまなベンチマーク テストで OpenAI の GPT-4 や Google の Gemini 1.0 Ultra を上回ったと主張しました。

ただし、より複雑な推論タスクを処理し、よりインテリジェントになり、より速く応答する能力、つまり上位 3 つの大型モデルにランクされるこれらの包括的な能力は、Claude3 の基本的なスキルにすぎません。

Anthropic は、法人顧客にとっての最良のパートナーになることに尽力しています。

これは、Haiku、Sonnet、Opus の一連のモデルである Claude3 に初めて反映されており、企業顧客は独自のシナリオに応じて、異なるパフォーマンスと異なるコストのバージョンを選択できます。

第二に、Anthropic は独自のモデルが最も安全であることを強調しています。 Anthropic のダニエラ・アモデイ社長は、安全性、信頼性、信頼性を高めるために、Claude3 の訓練に「憲法上の人工知能」と呼ばれる技術が導入されたと紹介しました。

エディンバラ大学で大規模モデルと推論を専攻する博士課程の学生、Fu Yao 氏は、Claude3 の技術レポートを読んだ後、Claude3 が、特に金融分野と医療分野における複雑な推論のベンチマーク テストで優れたパフォーマンスを発揮したと指摘しました。 ToB 企業として、Anthropic は最も利益の可能性が高い分野の最適化に重点を置くことを選択しました。

現在、Anthropic は Claude3 シリーズの 2 つのモデル (Haiku と Sonnet) を 159 か国で使用できるようになっており、最も強力なバージョンである Opus も発売されようとしています。同時に、Anthropic は Amazon と Google のクラウド プラットフォームを通じてサービスも提供しており、後者は Anthropic にそれぞれ 40 億米ドルと 20 億米ドルを投資しています。

共同創設者のダリオ・アモデイとダニエラ・アモデイは、Claude 3 のリリースは「Anthropic は企業というよりエンタープライズ企業であることを改めて示している」と述べました。企業。消費者企業。」|画像ソース: Anthropic

刚刚曝光的 Claude3,直击 OpenAI 最大弱点
01、
よりスマート、より応答性の高い

Claude3 ファミリー: Opus 、Sonnet Anthropic の公式 Web サイトによると、Claude3 は、Claude 3 Haiku、Claude 3 Sonnet、Claude 3 Opus の 3 つの最先端モデルを含む一連のモデルです。特定のアプリケーションに合わせて選択します。 インテリジェンス、スピード、コストの最適なバランスを実現します。 モデルの一般的な機能に関して、Anthropic 氏は、Claude 3 シリーズは、分析と予測、詳細なコンテンツ生成、コード生成、およびスペイン語、日本語 フランス語など英語以外の言語との会話においては、より強力な能力を持ち、タスクへの応答においてよりタイムリーです。 その中で、Claude 3 Opus は、特に非常に複雑なタスクの処理において、このモデル グループの中で最もインテリジェントなモデルです。 Opus は、学部レベルの専門知識 (MMLU)、大学院レベルの専門推論 (GPQA)、基礎数学 (GSM8K) など、ほとんどの一般的なベンチマークで同業他社を上回っています。これは、人間レベルに近い理解力と、複雑なタスクに対する流暢さを示しており、現時点では Anthropic による一般知能の最も最先端の探求であり、「生成型人工知能の限界を実証する」ものです。

Claude3 モデル ファミリー|画像出典: Anthropic

Claude 3 Sonnet は、知能レベルと応答性の理想的なバランスを実現します。エンタープライズ シナリオのタスクに適しています。同様の製品よりも低コストで強力なパフォーマンスを提供し、大規模な AI 導入で高い耐久性を実現できるように設計されています。大部分のワークロードにおいて、Sonnet は Claude 2 および Claude 2.1 よりも 2 倍高速でインテリジェントです。ナレッジ検索やセールスオートメーションなど、素早い対応が必要なタスクに優れています。

Claude 3 Haiku は、最もコンパクトなモデルであり、最もコスト効率が高いモデルです。また、応答速度も非常に速く、arXiv 上のチャート、グラフ、データ量の多い研究論文(約 10,000 トークン)を含む情報を 3 秒以内に読み込むことができます。 刚刚曝光的 Claude3,直击 OpenAI 最大弱点
02、
企業顧客をターゲットとしたイテレーション

共同創設者のダニエラ・アモデイ氏は、一般知能の進歩に加えて、Anthropic は特別な注意を払っていると紹介しました。生成 AI をビジネスに統合する際には、多くの課題に直面します。 Claude3 ファミリは企業顧客を対象としており、ビジュアル機能、精度、長いテキスト入力、およびセキュリティが向上しています。

多くの企業顧客は、PDF、フローチャート、プレゼンテーション スライドなどの複数の形式のナレッジ ベースを持っています。 Claude 3 シリーズ モデルは、写真、チャート、グラフ、技術図など、さまざまなビジュアル形式のコンテンツを処理できるようになりました。

Claude3 は、精度と長いテキスト ウィンドウの機能についても最適化されています。

正確性の観点から、Anthropic は多数の複雑な事実に基づく質問を使用して現在のモデルの既知の弱点をターゲットにし、回答を正解、不正解 (または幻覚) に分類し、不確実性を認識します。したがって、Claude3 モデルは、誤った情報を提供するのではなく、答えがわからないことを示します。これらすべての中で最も強力なバージョンである Claude 3 Opus は、Claude 2.1 よりも難しい自由形式の質問の精度 (または正解) が 2 倍になり、不正解のレベルも減少しました。

刚刚曝光的 Claude3,直击 OpenAI 最大弱点
#Claude2.1 バージョンと比較して、Claude3 シリーズは応答精度が総合的に向上しました。 |画像出典:Anthropic
同時に、コンテキスト理解機能の向上により、Claude3 ファミリは、以前のバージョンと比較して、ユーザーのタスクに応じて拒否されることが少なくなります。

より正確な返答に加えて、

Anthropic は、

をクロード 3 「引用# にもたらすだろうと述べました。 ## 参考資料内の正確な文を指定して答えを確認できる機能 現在、Claude 3 シリーズ モデルは 200K トークンのコンテキスト ウィンドウを提供します。その後、3 つのモデルすべてで 100 万を超えるトークンの入力を受け入れることができるようになり、この機能は強化された処理能力を必要とする一部の顧客に提供される予定です。 Anthropic は、技術レポートの中で、より長い文脈上の手がかり単語を効果的に処理する機能やリコール機能など、Claude3 の上部テキスト ウィンドウ機能について簡単に詳しく説明しました。

03,

「憲法上の人工知能」, 「不正確な科学」への対処 注目に値するのは、マルチモーダル モデルとして、Claude3 は画像を入力できますが、画像コンテンツを出力することはできません。共同創設者のダニエラ・アモデイ氏は、その理由について「企業が画像を必要としていることがはるかに少ないことがわかった」ためだと述べた。

Claude3 のリリースは、Google Gemini によって生成された画像によって引き起こされた論争の後にリリースされましたが、Claude は企業顧客を対象としており、AI によって引き起こされる価値観の偏りなどの問題を制御し、バランスを取ることも義務付けられています。

これに関して、ダリオ・アモデイ氏は、人工知能モデルを「不正確な科学」と呼んで、制御の難しさを強調しました。同氏は、同社にはこのモデルによってもたらされるさまざまなリスクの評価と軽減に専念する専門チームがいると述べた。

もう一人の共同創設者であるダニエラ・アモデイ氏も、完全に偏りのない AI は現在の手法では不可能である可能性があることを認めました。 「

完全に中立的な生成 AI ツールを作成することは、技術的にだけでなく、中立性とは何かについて誰もが同意しているわけではないため、ほぼ不可能です。」と彼女は言いました。

以前、Anthropic は、大規模なモデルを調整するために使用される「憲法上の人工知能」を発表しました | 画像出典: Anthropic

それにもかかわらず、 Anthropic は、モデルを人間の幅広い価値観と可能な限り一致させるために、「憲法人工知能」と呼ばれる手法を使用し、「憲法」で定義された原則に従ってモデルを調整および最適化します。 刚刚曝光的 Claude3,直击 OpenAI 最大弱点
OpenAIの中核的な人間開発者として、アモデイ兄弟姉妹の退職は、OpenAIはもはや非営利団体ではなく、もはやその本来の使命に従っていないと考えているマスク氏のOpenAIに対する最近の苦情と似ている。人類に利益をもたらします。記者はアモデイに、Anthropic は海外でビジネスを始めるというあなたのビジョンに適合しますか?と尋ねました。
アモデイ氏は、「人工知能開発の最前線に立つことが、人工知能の開発軌道を導き、社会に前向きな結果をもたらす最も効果的な方法である。」と述べた。この記事は WeChat 公開アカウントからのものです: Geek Park (ID: geekpark)、著者: Wan Chen

以上が公開されたばかりの Claude3 は OpenAI の最大の弱点を直接攻撃しますの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

関連ラベル:
ソース:ithome.com
このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。
最新の問題
人気のチュートリアル
詳細>
最新のダウンロード
詳細>
ウェブエフェクト
公式サイト
サイト素材
フロントエンドテンプレート