公開されたばかりの Claude3 は OpenAI の最大の弱点を直接攻撃します
エンタープライズ レベルの SOTA 大規模モデル、Anthropic の Claude3 はどのようなシグナルをリリースしますか?
著者 | Wan Chen
編集者 | Jingyu
は、OpenAI GPT3 の責任者としての起業家プロジェクトです。研究開発部門の Anthropic は、OpenAI と最も競合できるスタートアップとみなされています。
Anthropic は、現地時間月曜日に一連の大型 Claude 3 シリーズ モデルをリリースし、同社の最も強力なモデルがさまざまなベンチマーク テストで OpenAI の GPT-4 や Google の Gemini 1.0 Ultra を上回ったと主張しました。
ただし、より複雑な推論タスクを処理し、よりインテリジェントになり、より速く応答する能力、つまり上位 3 つの大型モデルにランクされるこれらの包括的な能力は、Claude3 の基本的なスキルにすぎません。
Anthropic は、法人顧客にとっての最良のパートナーになることに尽力しています。
これは、Haiku、Sonnet、Opus の一連のモデルである Claude3 に初めて反映されており、企業顧客は独自のシナリオに応じて、異なるパフォーマンスと異なるコストのバージョンを選択できます。 第二に、Anthropic は独自のモデルが最も安全であることを強調しています。 Anthropic のダニエラ・アモデイ社長は、安全性、信頼性、信頼性を高めるために、Claude3 の訓練に「憲法上の人工知能」と呼ばれる技術が導入されたと紹介しました。エディンバラ大学で大規模モデルと推論を専攻する博士課程の学生、Fu Yao 氏は、Claude3 の技術レポートを読んだ後、Claude3 が、特に金融分野と医療分野における複雑な推論のベンチマーク テストで優れたパフォーマンスを発揮したと指摘しました。 ToB 企業として、Anthropic は最も利益の可能性が高い分野の最適化に重点を置くことを選択しました。
現在、Anthropic は Claude3 シリーズの 2 つのモデル (Haiku と Sonnet) を 159 か国で使用できるようになっており、最も強力なバージョンである Opus も発売されようとしています。同時に、Anthropic は Amazon と Google のクラウド プラットフォームを通じてサービスも提供しており、後者は Anthropic にそれぞれ 40 億米ドルと 20 億米ドルを投資しています。
共同創設者のダリオ・アモデイとダニエラ・アモデイは、Claude 3 のリリースは「Anthropic は企業というよりエンタープライズ企業であることを改めて示している」と述べました。企業。消費者企業。」|画像ソース: Anthropic

Claude3 ファミリー: Opus 、Sonnet Anthropic の公式 Web サイトによると、Claude3 は、Claude 3 Haiku、Claude 3 Sonnet、Claude 3 Opus の 3 つの最先端モデルを含む一連のモデルです。特定のアプリケーションに合わせて選択します。 インテリジェンス、スピード、コストの最適なバランスを実現します。 モデルの一般的な機能に関して、Anthropic 氏は、Claude 3 シリーズは、分析と予測、詳細なコンテンツ生成、コード生成、およびスペイン語、日本語 フランス語など英語以外の言語との会話においては、より強力な能力を持ち、タスクへの応答においてよりタイムリーです。 その中で、Claude 3 Opus は、特に非常に複雑なタスクの処理において、このモデル グループの中で最もインテリジェントなモデルです。 Opus は、学部レベルの専門知識 (MMLU)、大学院レベルの専門推論 (GPQA)、基礎数学 (GSM8K) など、ほとんどの一般的なベンチマークで同業他社を上回っています。これは、人間レベルに近い理解力と、複雑なタスクに対する流暢さを示しており、現時点では Anthropic による一般知能の最も最先端の探求であり、「生成型人工知能の限界を実証する」ものです。
Claude3 モデル ファミリー|画像出典: AnthropicClaude 3 Sonnet は、知能レベルと応答性の理想的なバランスを実現します。エンタープライズ シナリオのタスクに適しています。同様の製品よりも低コストで強力なパフォーマンスを提供し、大規模な AI 導入で高い耐久性を実現できるように設計されています。大部分のワークロードにおいて、Sonnet は Claude 2 および Claude 2.1 よりも 2 倍高速でインテリジェントです。ナレッジ検索やセールスオートメーションなど、素早い対応が必要なタスクに優れています。
共同創設者のダニエラ・アモデイ氏は、一般知能の進歩に加えて、Anthropic は特別な注意を払っていると紹介しました。生成 AI をビジネスに統合する際には、多くの課題に直面します。 Claude3 ファミリは企業顧客を対象としており、ビジュアル機能、精度、長いテキスト入力、およびセキュリティが向上しています。
多くの企業顧客は、PDF、フローチャート、プレゼンテーション スライドなどの複数の形式のナレッジ ベースを持っています。 Claude 3 シリーズ モデルは、写真、チャート、グラフ、技術図など、さまざまなビジュアル形式のコンテンツを処理できるようになりました。
Claude3 は、精度と長いテキスト ウィンドウの機能についても最適化されています。 正確性の観点から、Anthropic は多数の複雑な事実に基づく質問を使用して現在のモデルの既知の弱点をターゲットにし、回答を正解、不正解 (または幻覚) に分類し、不確実性を認識します。したがって、Claude3 モデルは、誤った情報を提供するのではなく、答えがわからないことを示します。これらすべての中で最も強力なバージョンである Claude 3 Opus は、Claude 2.1 よりも難しい自由形式の質問の精度 (または正解) が 2 倍になり、不正解のレベルも減少しました。

#Claude2.1 バージョンと比較して、Claude3 シリーズは応答精度が総合的に向上しました。 |画像出典:Anthropic同時に、コンテキスト理解機能の向上により、Claude3 ファミリは、以前のバージョンと比較して、ユーザーのタスクに応じて拒否されることが少なくなります。 より正確な返答に加えて、
Anthropic は、 をクロード 3 「引用」# にもたらすだろうと述べました。 ## 参考資料内の正確な文を指定して答えを確認できる機能 。 現在、Claude 3 シリーズ モデルは 200K トークンのコンテキスト ウィンドウを提供します。その後、3 つのモデルすべてで 100 万を超えるトークンの入力を受け入れることができるようになり、この機能は強化された処理能力を必要とする一部の顧客に提供される予定です。 Anthropic は、技術レポートの中で、より長い文脈上の手がかり単語を効果的に処理する機能やリコール機能など、Claude3 の上部テキスト ウィンドウ機能について簡単に詳しく説明しました。
03,
「憲法上の人工知能」, 「不正確な科学」への対処 注目に値するのは、マルチモーダル モデルとして、Claude3 は画像を入力できますが、画像コンテンツを出力することはできません。共同創設者のダニエラ・アモデイ氏は、その理由について「企業が画像を必要としていることがはるかに少ないことがわかった」ためだと述べた。
Claude3 のリリースは、Google Gemini によって生成された画像によって引き起こされた論争の後にリリースされましたが、Claude は企業顧客を対象としており、AI によって引き起こされる価値観の偏りなどの問題を制御し、バランスを取ることも義務付けられています。 これに関して、ダリオ・アモデイ氏は、人工知能モデルを「不正確な科学」と呼んで、制御の難しさを強調しました。同氏は、同社にはこのモデルによってもたらされるさまざまなリスクの評価と軽減に専念する専門チームがいると述べた。 もう一人の共同創設者であるダニエラ・アモデイ氏も、完全に偏りのない AI は現在の手法では不可能である可能性があることを認めました。 「完全に中立的な生成 AI ツールを作成することは、技術的にだけでなく、中立性とは何かについて誰もが同意しているわけではないため、ほぼ不可能です。」と彼女は言いました。
以前、Anthropic は、大規模なモデルを調整するために使用される「憲法上の人工知能」を発表しました | 画像出典: Anthropic
それにもかかわらず、 Anthropic は、モデルを人間の幅広い価値観と可能な限り一致させるために、「憲法人工知能」と呼ばれる手法を使用し、「憲法」で定義された原則に従ってモデルを調整および最適化します。
OpenAIの中核的な人間開発者として、アモデイ兄弟姉妹の退職は、OpenAIはもはや非営利団体ではなく、もはやその本来の使命に従っていないと考えているマスク氏のOpenAIに対する最近の苦情と似ている。人類に利益をもたらします。記者はアモデイに、Anthropic は海外でビジネスを始めるというあなたのビジョンに適合しますか?と尋ねました。 アモデイ氏は、「人工知能開発の最前線に立つことが、人工知能の開発軌道を導き、社会に前向きな結果をもたらす最も効果的な方法である。」と述べた。この記事は WeChat 公開アカウントからのものです: Geek Park (ID: geekpark)、著者: Wan Chen


以上が公開されたばかりの Claude3 は OpenAI の最大の弱点を直接攻撃しますの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

ホットAIツール

Undresser.AI Undress
リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover
写真から衣服を削除するオンライン AI ツール。

Undress AI Tool
脱衣画像を無料で

Clothoff.io
AI衣類リムーバー

AI Hentai Generator
AIヘンタイを無料で生成します。

人気の記事

ホットツール

メモ帳++7.3.1
使いやすく無料のコードエディター

SublimeText3 中国語版
中国語版、とても使いやすい

ゼンドスタジオ 13.0.1
強力な PHP 統合開発環境

ドリームウィーバー CS6
ビジュアル Web 開発ツール

SublimeText3 Mac版
神レベルのコード編集ソフト(SublimeText3)

ホットトピック









このサイトは6月27日、JianyingはByteDanceの子会社であるFaceMeng Technologyによって開発されたビデオ編集ソフトウェアであり、Douyinプラットフォームに依存しており、基本的にプラットフォームのユーザー向けに短いビデオコンテンツを作成すると報告しました。 Windows、MacOS、その他のオペレーティング システム。 Jianyingは会員システムのアップグレードを正式に発表し、インテリジェント翻訳、インテリジェントハイライト、インテリジェントパッケージング、デジタルヒューマン合成などのさまざまなAIブラックテクノロジーを含む新しいSVIPを開始しました。価格的には、クリッピングSVIPの月額料金は79元、年会費は599元(当サイト注:月額49.9元に相当)、継続月額サブスクリプションは月額59元、継続年間サブスクリプションは、年間499元(月額41.6元に相当)です。さらに、カット担当者は、ユーザーエクスペリエンスを向上させるために、オリジナルのVIPに登録している人は、

検索強化生成およびセマンティック メモリを AI コーディング アシスタントに組み込むことで、開発者の生産性、効率、精度を向上させます。 JanakiramMSV 著者の EnhancingAICodingAssistantswithContextUsingRAGandSEM-RAG から翻訳。基本的な AI プログラミング アシスタントは当然役に立ちますが、ソフトウェア言語とソフトウェア作成の最も一般的なパターンに関する一般的な理解に依存しているため、最も適切で正しいコードの提案を提供できないことがよくあります。これらのコーディング アシスタントによって生成されたコードは、彼らが解決する責任を負っている問題の解決には適していますが、多くの場合、個々のチームのコーディング標準、規約、スタイルには準拠していません。これにより、コードがアプリケーションに受け入れられるように修正または調整する必要がある提案が得られることがよくあります。

大規模言語モデル (LLM) は巨大なテキスト データベースでトレーニングされ、そこで大量の現実世界の知識を取得します。この知識はパラメータに組み込まれており、必要なときに使用できます。これらのモデルの知識は、トレーニングの終了時に「具体化」されます。事前トレーニングの終了時に、モデルは実際に学習を停止します。モデルを調整または微調整して、この知識を活用し、ユーザーの質問により自然に応答する方法を学びます。ただし、モデルの知識だけでは不十分な場合があり、モデルは RAG を通じて外部コンテンツにアクセスできますが、微調整を通じてモデルを新しいドメインに適応させることが有益であると考えられます。この微調整は、ヒューマン アノテーターまたは他の LLM 作成物からの入力を使用して実行され、モデルは追加の実世界の知識に遭遇し、それを統合します。

AIモデルによって与えられた答えがまったく理解できない場合、あなたはそれをあえて使用しますか?機械学習システムがより重要な分野で使用されるにつれて、なぜその出力を信頼できるのか、またどのような場合に信頼してはいけないのかを実証することがますます重要になっています。複雑なシステムの出力に対する信頼を得る方法の 1 つは、人間または他の信頼できるシステムが読み取れる、つまり、考えられるエラーが発生する可能性がある点まで完全に理解できる、その出力の解釈を生成することをシステムに要求することです。見つかった。たとえば、司法制度に対する信頼を築くために、裁判所に対し、決定を説明し裏付ける明確で読みやすい書面による意見を提供することを求めています。大規模な言語モデルの場合も、同様のアプローチを採用できます。ただし、このアプローチを採用する場合は、言語モデルが

編集者 |ScienceAI 質問応答 (QA) データセットは、自然言語処理 (NLP) 研究を促進する上で重要な役割を果たします。高品質の QA データ セットは、モデルの微調整に使用できるだけでなく、大規模言語モデル (LLM) の機能、特に科学的知識を理解し推論する能力を効果的に評価することもできます。現在、医学、化学、生物学、その他の分野をカバーする多くの科学 QA データ セットがありますが、これらのデータ セットにはまだいくつかの欠点があります。まず、データ形式は比較的単純で、そのほとんどが多肢選択式の質問であり、評価は簡単ですが、モデルの回答選択範囲が制限され、科学的な質問に回答するモデルの能力を完全にテストすることはできません。対照的に、自由回答型の Q&A

編集者 | KX 医薬品の研究開発の分野では、タンパク質とリガンドの結合親和性を正確かつ効果的に予測することが、医薬品のスクリーニングと最適化にとって重要です。しかし、現在の研究では、タンパク質とリガンドの相互作用における分子表面情報の重要な役割が考慮されていません。これに基づいて、アモイ大学の研究者らは、初めてタンパク質の表面、3D 構造、配列に関する情報を組み合わせ、クロスアテンション メカニズムを使用して異なるモダリティの特徴を比較する、新しいマルチモーダル特徴抽出 (MFE) フレームワークを提案しました。アライメント。実験結果は、この方法がタンパク質-リガンド結合親和性の予測において最先端の性能を達成することを実証しています。さらに、アブレーション研究は、この枠組み内でのタンパク質表面情報と多峰性特徴の位置合わせの有効性と必要性を実証しています。 「S」で始まる関連研究

7月5日のこのウェブサイトのニュースによると、グローバルファウンドリーズは今年7月1日にプレスリリースを発行し、自動車とインターネットでの市場シェア拡大を目指してタゴール・テクノロジーのパワー窒化ガリウム(GaN)技術と知的財産ポートフォリオを買収したことを発表した。モノと人工知能データセンターのアプリケーション分野で、より高い効率とより優れたパフォーマンスを探求します。生成 AI などのテクノロジーがデジタル世界で発展を続ける中、窒化ガリウム (GaN) は、特にデータセンターにおいて、持続可能で効率的な電力管理のための重要なソリューションとなっています。このウェブサイトは、この買収中にタゴール・テクノロジーのエンジニアリングチームがGLOBALFOUNDRIESに加わり、窒化ガリウム技術をさらに開発するという公式発表を引用した。 G

8月1日の本サイトのニュースによると、SKハイニックスは本日(8月1日)ブログ投稿を発表し、8月6日から8日まで米国カリフォルニア州サンタクララで開催されるグローバル半導体メモリサミットFMS2024に参加すると発表し、多くの新世代の製品。フューチャー メモリおよびストレージ サミット (FutureMemoryandStorage) の紹介。以前は主に NAND サプライヤー向けのフラッシュ メモリ サミット (FlashMemorySummit) でしたが、人工知能技術への注目の高まりを背景に、今年はフューチャー メモリおよびストレージ サミット (FutureMemoryandStorage) に名前が変更されました。 DRAM およびストレージ ベンダー、さらに多くのプレーヤーを招待します。昨年発売された新製品SKハイニックス
