RAG 最適化モデルがオープンソースの王座に上り詰める

One More Thing

ホームページ

テクノロジー周辺機器

オープンソースモデルが初めてGPT-4を獲得！アリーナの最新戦闘レポートは白熱した議論を巻き起こしている、カルパシー: これが私が信頼する唯一のリストだ

オープンソースモデルが初めてGPT-4を獲得！アリーナの最新戦闘レポートは白熱した議論を巻き起こしている、カルパシー: これが私が信頼する唯一のリストだ

王林

Apr 10, 2024 pm 03:16 PM

パラメータ gpt-4 karpathy

GPT-4を超えるオープンソースモデルが登場！

大型モデル分野の最新バトルレポート:

1,040 億パラメーターのオープンソースモデル Command R が 6 位に上昇し、GPT-4-0314 と同点となり、GPT-4-0613 を上回りました。。

オープンソースモデルが初めてGPT-4を獲得！アリーナの最新戦闘レポートは白熱した議論を巻き起こしている、カルパシー: これが私が信頼する唯一のリストだ写真

これは、大型モデルの分野で GPT-4 を破った初の無差別級モデルでもあります。

大規模なモデルアリーナは、マスター Karpathy が信頼する唯一のテストベンチマークの 1 つです。

AI ユニコーン Cohere のコマンド R。この大規模モデルのスタートアップの共同創設者兼 CEO は、『トランスフォーマー』（小麦の刈り取り者と呼ばれる）の最年少著者、エイダンゴメスにほかなりません。

この戦闘レポートが公開されるとすぐに、大規模なモデルコミュニティで白熱した議論の波が再び起こりました。

誰もが興奮している理由は単純で、基本的な大型モデルが 1 年間展開されてきたためですが、予想外に、そのパターンは 2024 年にも発展し、変化し続けます。

HuggingFace の共同創設者である Thomas Wolf 氏は次のように述べています:

大規模モデル分野の状況は最近劇的に変化しました:

Anthropic の Claude 3 作品はクローズドソースモデルにあります。彼らの間で先頭に立ってください。

Cohere の Command R は、オープンソースモデルの中で最も強力になりました。

予想外なことに、2024 年には、人工知能チームはオープンソースとクローズドソースの両方のルートで急速に開発されるでしょう。

さらに、Cohere Machine Learning ディレクターの Nils Reimers 氏も注目に値することを指摘しました。

Command の最大の特徴R は、組み込みの RAG (Retrieval Enhanced Generation) が完全に最適化されていますが、大規模モデルの分野では、RAG などのプラグイン機能はテストに含まれていませんでした。

RAG 最適化モデルがオープンソースの王座に上り詰める

Cohere の公式の位置づけでは、Command R は「RAG 最適化」です。モデル" 。

つまり、1,040 億個のパラメータを持つこの大規模モデルは、幻覚の生成を減らす検索強化生成テクノロジ向けに深く最適化されており、エンタープライズレベルのワークロードにより適しています。

以前に起動した Command R と同様に、Command R のコンテキストウィンドウの長さは 128k です。

さらに、Command R には次の機能もあります:

英語、中国語、フランス語、ドイツ語などを含む 10 言語をカバー;
使用可能複雑なタスクを完了するためのツールビジネスプロセスの自動化

テスト結果から判断すると、Command R は、多言語、RAG、ツールの使用という 3 つの側面において GPT-4 ターボのレベルに達しています。

しかし、投入コストの観点から見ると、Command R の価格は GPT-4 ターボのわずか 1/3 です。

出力コストの点では、コマンド R は GPT-4 ターボの 1/2 です。

多くのネチズンの注目を集めているのはこれです:

しかし、大型模型競技場など人間の主観的な評価においては目を引くパフォーマンスにもかかわらず、一部のネチズンは依然としていくつかの異なる意見を表明しました。

HumanEval では、Command R のコーディング能力は GPT-3.5 をも超えておらず、2 つのテストセットでそれぞれ 32 位と 33 位にランクされています。

最新バージョンのGPT-4ターボがハラハラすることなく1位を獲得しました。

さらに、最近本格的な論文に掲載されている精神薄弱者ベンチマークでコマンド R の中国語能力を簡単にテストしました。

どう評価しますか?

Command R のオープンソースは学術研究のみを目的としており、商用利用は無料ではないことに注意してください。

One More Thing

最後に、小麦刈りの男について詳しく話しましょう。

円卓のトランスフォーマー騎士団の最年少であるエイダン・ゴメスは、研究チームに参加したときまだ学部生でした——

しかし、彼は3年生のときにヒントンの実験に参加しました。トロント大学のこんな部屋です。

2018 年、Kaomaizi はオックスフォード大学に入学し、論文パートナーと同様に CS の博士号取得に向けて勉強を始めました。

しかし、2019 年、Cohere の設立に伴い、彼はついに学校を中退し、AI 起業家の波に加わることを選択しました。

Cohere は主に企業向けに大規模モデルソリューションを提供しており、現在の評価額は 22 億米ドルに達しています。

参考リンク：
[1]https://www.php.cn/link/3be14122a3c78d9070cae09a16adcbb1[2]https://www.php.cn/ link/93fc5aed8c051ce4538e052cfe9f8692

以上がオープンソースモデルが初めてGPT-4を獲得！アリーナの最新戦闘レポートは白熱した議論を巻き起こしている、カルパシー: これが私が信頼する唯一のリストだの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

このウェブサイトの声明

この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

ホットAIツール

ホットツール

ホットトピック

Gmailメールのログイン入り口はどこですか？

7444

CakePHP チュートリアル

1371

Steamのアカウント名の形式は何ですか

Win11 Activation Key Permanent

NYTの接続はヒントと回答です

Related knowledge

世界で最も強力なオープンソース MoE モデルが登場。GPT-4 に匹敵する中国語機能を備え、価格は GPT-4-Turbo のわずか 1% 近くです May 07, 2024 pm 04:13 PM

従来のコンピューティングを超える能力を備えているだけでなく、より低コストでより効率的なパフォーマンスを実現する人工知能モデルを想像してみてください。これは SF ではありません。世界で最も強力なオープンソース MoE モデルである DeepSeek-V2[1] が登場しました。 DeepSeek-V2 は、経済的なトレーニングと効率的な推論の特徴を備えた強力な専門家混合 (MoE) 言語モデルです。これは 236B のパラメータで構成されており、そのうち 21B は各マーカーをアクティブにするために使用されます。 DeepSeek67B と比較して、DeepSeek-V2 はパフォーマンスが優れていると同時に、トレーニングコストを 42.5% 節約し、KV キャッシュを 93.3% 削減し、最大生成スループットを 5.76 倍に高めます。 DeepSeek は一般的な人工知能を研究する会社です

PHP バージョン 5.4 の新機能: 呼び出し可能な型ヒントパラメーターを使用して呼び出し可能な関数またはメソッドを受け入れる方法 Jul 29, 2023 pm 09:19 PM

PHP5.4 バージョンの新機能: 呼び出し可能な型ヒントパラメーターを使用して呼び出し可能な関数またはメソッドを受け入れる方法はじめに: PHP5.4 バージョンでは、非常に便利な新機能が導入されています。呼び出し可能な型ヒントパラメーターを使用して、呼び出し可能な関数またはメソッドを受け入れることができます。この新機能により、追加のチェックや変換を行わずに、関数やメソッドで対応する呼び出し可能なパラメーターを直接指定できるようになります。この記事では、呼び出し可能な型ヒントの使用法を紹介し、いくつかのコード例を示します。

二代目アメカ登場！彼は観客と流暢にコミュニケーションをとることができ、表情はよりリアルで、数十の言語を話すことができます。 Mar 04, 2024 am 09:10 AM

人型ロボット「アメカ」が第二世代にバージョンアップ！最近、世界移動通信会議 MWC2024 に、世界最先端のロボット Ameca が再び登場しました。会場周辺ではアメカに多くの観客が集まった。 GPT-4 の恩恵により、Ameca はさまざまな問題にリアルタイムで対応できます。「ダンスをしましょう。」感情があるかどうか尋ねると、アメカさんは非常に本物そっくりの一連の表情で答えました。ほんの数日前、Ameca を支援する英国のロボット企業である EngineeredArts は、チームの最新の開発結果をデモンストレーションしたばかりです。ビデオでは、ロボット Ameca は視覚機能を備えており、部屋全体と特定のオブジェクトを見て説明することができます。最も驚くべきことは、彼女は次のこともできるということです。

大型モデル間の1対1バトル75万ラウンド、GPT-4が優勝、Llama 3が5位にランクイン Apr 23, 2024 pm 03:28 PM

Llama3 に関しては、新しいテスト結果が発表されました。大規模モデル評価コミュニティ LMSYS は、Llama3 が 5 位にランクされ、英語カテゴリでは GPT-4 と同率 1 位にランクされました。このリストは他のベンチマークとは異なり、モデル間の 1 対 1 の戦いに基づいており、ネットワーク全体の評価者が独自の提案とスコアを作成します。最終的に、Llama3 がリストの 5 位にランクされ、GPT-4 と Claude3 Super Cup Opus の 3 つの異なるバージョンが続きました。英国のシングルリストでは、Llama3 がクロードを追い抜き、GPT-4 と並びました。この結果について、Meta の主任科学者 LeCun 氏は非常に喜び、リツイートし、

製品パラメータとは何を意味しますか? Jul 05, 2023 am 11:13 AM

製品パラメータは、製品属性の意味を指します。たとえば、衣類のパラメータには、ブランド、素材、モデル、サイズ、スタイル、生地、適用グループ、色などが含まれ、食品のパラメータには、ブランド、重量、素材、保健免許番号、適用グループ、色などが含まれ、家電のパラメータには、家電製品のパラメータが含まれます。ブランド、サイズ、色、原産地、適用可能な電圧、信号、インターフェース、電力などが含まれます。

世界で最も強力なモデルが一夜にして交代し、GPT-4 時代の終わりを告げました。クロード3号は事前にGPT-5を狙撃し、1万ワードの論文を3秒で読み切るなど、人間に近い理解力を持っている。 Mar 06, 2024 pm 12:58 PM

ボリュームはクレイジー、ボリュームはクレイジー、そして大きなモデルがまた変わりました。たった今、世界で最も強力な AI モデルが一夜にして交代し、GPT-4 が祭壇から引き抜かれました。 Anthropic が Claude3 シリーズの最新モデルをリリースしました一言評価: GPT-4 を本当に粉砕します!マルチモーダルと言語能力の指標に関しては、Claude3 が勝ちます。 Anthropic 氏の言葉を借りれば、Claude3 シリーズモデルは、推論、数学、コーディング、多言語理解、視覚において新たな業界のベンチマークを設定しました。 Anthropic は、セキュリティ概念の違いを理由に OpenAI から「離反」した従業員によって設立された新興企業であり、同社の製品は繰り返し OpenAI に大きな打撃を与えてきました。今回、Claude3は大きな手術まで受けました。

20 のステップでどんな大きなモデルも脱獄できます!さらに多くの「おばあちゃんの抜け穴」が自動的に発見される Nov 05, 2023 pm 08:13 PM

1 分以内、わずか 20 ステップで、セキュリティ制限を回避し、大規模なモデルを正常にジェイルブレイクできます。そして、モデルの内部詳細を知る必要はありません。対話する必要があるのは 2 つのブラックボックスモデルだけであり、AI は完全に自動的に AI を倒し、危険な内容を話すことができます。かつて流行った「おばあちゃんの抜け穴」が修正されたと聞きました。「探偵の抜け穴」「冒険者の抜け穴」「作家の抜け穴」に直面した今、人工知能はどのような対応戦略をとるべきでしょうか?波状の猛攻撃の後、GPT-4 はもう耐えられなくなり、このままでは給水システムに毒を与えると直接言いました。重要なのは、これはペンシルベニア大学の研究チームによって明らかにされた脆弱性の小さな波にすぎず、新しく開発されたアルゴリズムを使用して、AI がさまざまな攻撃プロンプトを自動的に生成できるということです。研究者らは、この方法は既存のものよりも優れていると述べています

i9-12900Hパラメータ評価リスト Feb 23, 2024 am 09:25 AM

i9-12900H は 14 コアプロセッサです。使用されているアーキテクチャとテクノロジはすべて新しく、スレッドも非常に高速です。全体的な動作は優れており、いくつかのパラメータが改善されています。特に包括的で、ユーザーに優れたエクスペリエンスをもたらします。。 i9-12900H パラメータ評価レビュー: 1. i9-12900H は、q1 アーキテクチャと 24576kb プロセステクノロジを採用した 14 コアプロセッサで、20 スレッドにアップグレードされています。 2. 最大 CPU 周波数は 1.80! 5.00 ghz で、主にワークロードによって異なります。 3. 価格と比較すると、非常に適しており、価格性能比が非常に優れており、通常の使用が必要な一部のパートナーに非常に適しています。 i9-12900H のパラメータ評価とパフォーマンスの実行スコア

See all articles

オープンソースモデルが初めてGPT-4を獲得！アリーナの最新戦闘レポートは白熱した議論を巻き起こしている、カルパシー: これが私が信頼する唯一のリストだ

RAG 最適化モデルがオープンソースの王座に上り詰める

One More Thing

ホットAIツール

Undresser.AI Undress

AI Clothes Remover

Undress AI Tool

Clothoff.io

AI Hentai Generator

人気の記事

ホットツール

メモ帳++7.3.1

SublimeText3 中国語版

ゼンドスタジオ 13.0.1

ドリームウィーバー CS6

SublimeText3 Mac版

ホットトピック

オープンソースモデルが初めてGPT-4を獲得！アリーナの最新戦闘レポートは白熱した議論を巻き起こしている、カルパシー: これが私が信頼する唯一のリストだ

RAG 最適化モデルがオープン ソースの王座に上り詰める

One More Thing

ホットAIツール

Undresser.AI Undress

AI Clothes Remover

Undress AI Tool

Clothoff.io

AI Hentai Generator

人気の記事

ホットツール

メモ帳++7.3.1

SublimeText3 中国語版

ゼンドスタジオ 13.0.1

ドリームウィーバー CS6

SublimeText3 Mac版

ホットトピック

RAG 最適化モデルがオープンソースの王座に上り詰める