GPT-4oを倒せ！新しい王クロード 3.5 ソネットが登場、無料で直接入手可能-AI-php.cn

GPT-4oを倒せ！新しい王クロード 3.5 ソネットが登場、無料で直接入手可能

王林

リリース： 2024-06-22 01:08:30

オリジナル

1367 人が閲覧しました

現在、大型モデルの分野はさらに拡大しています!

OpenAI は前足で GPT4o をリリースし、ゲーム全体をコントロールしましたが、後足では最大の競合である Anthropic に追い抜かれました。

力压GPT-4o！新王Claude 3.5 Sonnet来了，直接免费可用

たった今、Anthropic はこれまでで最もスマートなモデルと言われている新しい大型モデル Claude 3.5 Sonnet をリリースしました

。

力压GPT-4o！新王Claude 3.5 Sonnet来了，直接免费可用

レポートによると、Claude 3.5 Sonnet は、Anthropic の今後の Claude 3.5 シリーズの最初のバージョンです。このモデルは、分野全体のインテリジェンスのレベルを向上させ、ほとんどのベンチマーク評価において、競合する大型モデルやその最も強力な前モデルである Claude 3 Opus を上回りました。同時に、動作速度とコストは前世代のクロード 3 ソネットと同等です。

アドレス: https://claude.ai/

現在、Claude 3.5 Sonnet はすでに Claude.ai と Claude iOS アプリで無料で利用可能ですが、Claude Pro および Team プランの加入者も入手できます。より高い料金でアクセスできます。

さらに、Claude 3.5 Sonnet はすでに Anthropic API、Amazon Cloud Technology Bedrock、その他のチャネルを通じて直接使用できます。 価格は入力トークン 100 万あたり 3 ドル、出力トークン 100 万あたり 15 ドル、コンテキストウィンドウは 200,000 トークンです

。

力压GPT-4o！新王Claude 3.5 Sonnet来了，直接免费可用

🎜

^「」

Anthropic は、パフォーマンス、速度、コストの間のトレードオフ曲線を数か月ごとに劇的に改善することを目指していると述べています。 Claude 3.5 Haiku と Claude 3.5 Opus は今年後半にリリースされる予定です。

次世代の大規模モデルの開発に加えて、Anthropic は、エンタープライズアプリケーションとの統合など、より多くのエンタープライズユースケースをサポートするための新しいパターンと機能を開発しています。チームはまた、モデルがユーザーの好みや指定されたインタラクション履歴を記憶できるようにするメモリーなどの機能も検討しており、よりパーソナライズされた効率的なエクスペリエンスを可能にします。

GPT-4o よりも賢い

Claude 3 Opus より 2 倍高速

Claude 3.5 Sonnet 大学院レベルの推論 (GPQA)、学部レベルの知識 (MMLU)コーディング機能 ( HumanEval) は、新しい業界のベンチマークを設定します 。ニュアンス、ユーモア、複雑な指示の理解が大幅に向上し、自然で親しみやすい口調で高品質のコンテンツを書くことに優れています。

クロード 3.5 ソネットは、クロード 3 オーパスの 2 倍の速度で実行されます。このパフォーマンスの向上と手頃な価格の組み合わせにより、Claude 3.5 Sonnet は複雑なタスクに最適です。

内部プロキシコーディング評価では、Claude 3.5 Sonnet は問題の 64% を解決し、Claude 3 Opus (38% 解決) よりも優れていました。 Anthropic 評価では、要件の自然言語記述に基づいてバグを修正したり、オープンソースコードベースに機能を追加したりする Claude 3.5 Sonnet の能力をテストしました。

ガイダンスと関連ツールを受け取った後、Claude 3.5 Sonnet は、高度な推論機能とトラブルシューティング機能を備えたコードを独自に作成、編集、実行できます。 Claude 3.5 Sonnet はコード変換を簡単に処理でき、レガシーアプリケーションの更新やコードベースの移行に特に効果的です。

次の表は、Claude 3.5 Sonnet と他のモデルを比較したものです。評価ベンチマークには、推論、読解、数学、科学、コーディングが含まれます。これらすべてのベンチマークにおいて、Claude 3.5 Sonnet は以前の最先端モデルである Claude 3 Opus を上回っています。

Claude3.5とGPT-4oの比較データも表で確認できます数学を除いて、スコアはGPT-4oよりも高いかそれに近いです。

力压GPT-4o！新王Claude 3.5 Sonnet来了，直接免费可用

これまでで最強のビジュアルモデル

Anthropic は、Claude 3.5 Sonnet が最強のビジュアルモデルであり、すべての標準ビジュアルベンチマークにおいて前任者の Claude 3 Opus を上回っていると述べています。

小売、物流、金融サービス業界の中核機能である、チャートやグラフの解釈、不完全な画像からのテキストの転写など、視覚的な推論を必要とするタスクでパフォーマンスが特に顕著になります。これらの分野では、AI はテキストだけからよりも画像、グラフィック、イラストからより多くの洞察を収集できます。

下の図は、ビジュアル数的推論、科学チャート、ビジュアル質問応答、チャートQA、ドキュメントビジュアルQAタスクにおけるClaude 3.5 SonnetとClaude 3 Opus、GPT-4o、Gemini 1.5 Proのパフォーマンスの比較を示しています。

力压GPT-4o！新王Claude 3.5 Sonnet来了，直接免费可用

アーティファクト – クロードの新しい使い方

Anthropic は、Claude.ai でアーティファクトを開始しました。これは、ユーザーがクロードと対話する方法を拡張する新機能です。ユーザーがコードスニペット、テキストドキュメント、Web サイトデザインなどの生成をクロードに依頼すると、これらの成果物が会話の隣の専用ウィンドウに表示されます。これにより、クロードの作品をリアルタイムで表示、編集、構築できる動的なワークスペースが作成され、AI が生成したコンテンツをプロジェクトやワークフローにシームレスに統合できます。

Artifacts プレビュー機能は、会話型 AI から共同作業環境への Claude の進化を示しており、間もなくチームのコラボレーションをサポートするように拡張される予定です。近い将来、チームは、クロードがオンデマンドでチームメイトとして機能することで、知識、文書、進行中の作業を共有スペースに安全に一元管理できるようになります。

最後に、Anthropic はモデルを厳密にテストし、悪用の可能性を減らすために取り組んでいると述べています。

Anthropic セキュリティチームは、化学、生物学、放射線、核 (CBRN) リスク、サイバーセキュリティ、自律機能の分野でクロード 3.5 ソネットの一連の評価を実施し、最終的にクロード 3.5 ソネットを AI セキュリティレベル 2 に分類しました。 ( ASL-2) モデルは、致命的な損傷の危険性がないことを示しています。

さらに、セキュリティと透明性への取り組みの一環として、Anthropic は外部の専門家と協力して、この最新モデルのセキュリティメカニズムをテストし、改良しています。

^{公式ブログアドレス：https://www.anthropic.com/news/claude-3-5-sonnet}

以上がGPT-4oを倒せ！新しい王クロード 3.5 ソネットが登場、無料で直接入手可能の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。