Gradient と Crusoe が Llama-3 の「コンテキスト ウィンドウ」を 100 万トークンに拡張するにつれて、オープンソースのロングコンテキスト LLM への競争が激化

WBOY
リリース: 2024-06-25 15:24:40
オリジナル
563 人が閲覧しました

最近のコラボレーションでは、AI スタートアップの Gradient とクラウド コンピューティング プラットフォーム Crusoe が、Llama-3 モデルの「コンテキスト ウィンドウ」を 100 万トークンに拡張しました。コンテキスト ウィンドウは、大規模言語モデル (LLM) が処理できる入力および出力トークンの数を決定します。

The Race to Open-Source Long-Context LLMs Heats Up as Gradient and Crusoe Extend Llama-3's

VentureBeat Transform 2024 には、OpenAI、Chevron、Nvidia、Kaiser Permanente、Capital One のリーダーが参加します。この 3 日間のイベントは、参加者に GenAI に関する重要な洞察を得てネットワークを拡大する機会を提供します。

最近のコラボレーションで、Gradient と Crusoe は、Llama-3 モデルのコンテキスト ウィンドウを 100 万トークンに拡張しました。コンテキスト ウィンドウは、大規模言語モデル (LLM) が処理できる入出力トークンの数を決定します。

大手テクノロジー企業とフロンティア AI ラボは、LLM のコンテキスト ウィンドウを拡張するために競い合っています。数か月のうちに、モデルは数千トークンのサポートから、1 年足らずで 100 万以上のトークンをサポートするようになりました。ただし、非常に長いコンテキスト ウィンドウを持つ LLM は、Anthropic Claude (200,000 トークン)、OpenAI GPT-4 (128,000 トークン)、Google Gemini (100 万トークン) などのプライベート モデルにほとんど限定されています。

オープンソースの作成競争長いコンテキスト ウィンドウを持つモデルは、LLM 市場を再編し、プライベート モデルでは不可能なアプリケーションのロックを解除する可能性があります。

Gradient は、LLM をワークフローに統合したい企業顧客と連携します。 Llama-3 が登場する前から、同社は顧客のために取り組んでいたプロジェクトにおいてコンテキストの問題点に直面していました。

ニュースソース:https://www.kdj.com/cryptocurrency-news/articles/race-source-context-llms-heats-gradient-crusoe-extend-llama-context-window-tokens.html

以上がGradient と Crusoe が Llama-3 の「コンテキスト ウィンドウ」を 100 万トークンに拡張するにつれて、オープンソースのロングコンテキスト LLM への競争が激化の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

ソース:kdj.com
このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。
人気のチュートリアル
詳細>
最新のダウンロード
詳細>
ウェブエフェクト
公式サイト
サイト素材
フロントエンドテンプレート