精密狙撃兵ラマ 3.1? Mistral AI オープンソース Large 2、123B は Llama 405B に相当-AI-php.cn

精密狙撃兵ラマ 3.1? Mistral AI オープンソース Large 2、123B は Llama 405B に相当

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

リリース： 2024-07-25 14:24:56

オリジナル

1046 人が閲覧しました

AI 競争はかつてないほど加速しており、昨日 Meta が新しいオープンソース Llama 3.1 モデルを発表したことに続き、フランスの AI スタートアップである Mistral AI がこの争いに加わりました。

ちょうど今、Mistral AI は次世代の主力オープンソースモデルである Mistral Large 2 を発表しました。これは 1,230 億のパラメーターを持ち、コード生成、数学、推理など。

Llama 3.1 405Bのリリースに続き、Mistral Large 2のリリースでオープンソースの大型モデルの流れが一気に活発化しましたが、このモデルの特徴は「十分な大きさ」です。

具体的には、Mistral Large 2 のパラメータ数は Llama 3.1 の 4,050 億よりも少ないですが、両者のパフォーマンスは近いです。また、複数のベンチマークにおいて GPT-4o や Anthropic の Claude 3.5 Sonnet に匹敵します。

精准狙击Llama 3.1？Mistral AI开源Large 2，123B媲美Llama 405B

今年 2 月、Mistral AI はオリジナルの大規模モデルを発表しました。そのコンテキストウィンドウには 32,000 個のトークンが含まれていました。モデルの新しいバージョンはこれに基づいて構築されており、128,000 個 (ほぼ同等) のより大きなコンテキストウィンドウを備えています。本) 300 ページの本) - OpenAI の GPT-4o および GPT-4o mini、および Meta の Llama 3.1 に一致します。

現在、Mistral Large 2 は、フランス語、ドイツ語、スペイン語、イタリア語、ポルトガル語、アラビア語、ヒンディー語、ロシア語、中国語、日本語、韓国語を含む数十の言語と、Python、Java、C、 C++、JavaScript、Bash。

Mistral AI は、新しいモデルがコスト効率、速度、パフォーマンスの限界を押し広げ続けると同時に、高性能 AI アプリケーションを構築するための高度な関数呼び出しや取得などの新機能をユーザーに提供すると指摘しています。

ただし、Mistral Large 2 は公開されていますが、研究および非商業的使用に限定されていることに注意してください。オープンウェイトを提供し、サードパーティがニーズに応じてモデルを微調整できるようにします。この契約は、ユーザーの使用条件に対する重要な制限です。 Mistral Large 2 の自己展開を必要とする商用利用の場合は、事前に Mistral AI 商用ライセンスを取得する必要があります。

パフォーマンス

複数の評価指標において、Mistral Large 2 はパフォーマンスとサービスコストの新たな基準を設定しました。特に MMLU では、事前トレーニング済みバージョンは 84.0% の精度を達成しました。

コードと推論

Mistral AI は、Codestral 22B と Codestral Mamba での以前の経験に基づいて、コードの大部分について Mistral Large 2 をトレーニングしました。

Mistral Large 2 は、前世代の Mistral Large よりもはるかに優れたパフォーマンスを発揮し、GPT-4o、Claude 3 Opus、Llama 3 405B などの上位モデルと同等です。

精准狙击Llama 3.1？Mistral AI开源Large 2，123B媲美Llama 405B

Mistral AI は、モデルの推論能力の強化にも多大な努力を払ってきました。重要なポイントの 1 つは、モデルが「幻覚」を生成したり、合理的であるように見えても実際には間違っていたりする情報を生成する傾向を最小限に抑えることです。関係ない。これは、応答がより慎重かつ鋭くなるようにモデルを微調整することで実現され、信頼性が高く正確な出力が確実に提供されます。

さらに、ミストラルラージ 2 は、解決策が見つからない場合、または自信を持って回答するのに十分な情報がない場合にはそれを認めます。この精度の追求は、数学ベンチマークのモデルパフォーマンスの改善に反映されており、次のグラフはその推論と問題解決機能の強化を示しています。同じ評価プロセス）。 MultiPL-E でのパフォーマンスの精度 (紙を除く、すべてのモデルが同じ評価プロセスを通じてベンチマークされます)。

精准狙击Llama 3.1？Mistral AI开源Large 2，123B媲美Llama 405B

GSM8K (8 ショット) および MATH (0 ショット、CoT なし) 世代のベンチマークでのパフォーマンス精度 (すべてのモデルは同じ評価プロセスでベンチマークされています)。

精准狙击Llama 3.1？Mistral AI开源Large 2，123B媲美Llama 405B

従って調整するための指示

Mistral AI hat die Befehlsfolge- und Konversationsfähigkeiten des Mistral Large 2 erheblich verbessert. Der neue Mistral Large 2 ist besonders gut darin, präzise Anweisungen zu befolgen und lange Gespräche mit mehreren Runden zu führen. T Das Folgende ist seine Leistung im MT-Bench-, Wild Bench- und Arena Hard-Benchmark-Test:

Die Leistung des Modells im universellen Ausrichtungstest (alle Modelle werden mit derselben Bewertungs-PIPELINE getestet) Bei einigen Benchmarks führt die Generierung längerer Antworten tendenziell zu besseren Bewertungen. In vielen kommerziellen Anwendungen ist jedoch Einfachheit von entscheidender Bedeutung, da eine präzise Modellgenerierung die Interaktionen beschleunigt und die Kosten für die Inferenz senkt.

Daher gibt sich Mistral AI viel Mühe, um sicherzustellen, dass die von ihm generierten Inhalte so prägnant und prägnant wie möglich sind.

Die folgende Abbildung zeigt die durchschnittliche Länge der von verschiedenen Modellen generierten Antworten auf die MT Bench-Benchmark-Frage:

Sprachvielfalt
Eine große Anzahl kommerzieller Anwendungsszenarien beinhaltet heute die Verarbeitung mehrsprachiger Dokumente. Mistral Large 2 wurde mit großen Mengen mehrsprachiger Daten trainiert, insbesondere in Englisch, Französisch, Deutsch, Spanisch, Italienisch, Portugiesisch, Niederländisch, Russisch, Chinesisch, Japanisch, Koreanisch, Arabisch und Hindi. Hervorragende Leistung.

Das Folgende sind die Leistungsergebnisse von Mistral Large 2 im mehrsprachigen MMLU-Benchmark, hauptsächlich im Vergleich zum Vorgängermodell Mistral Large, Llama 3.1 und Coheres Command R+: Sprache MMLU Leistung (gemessen mit vorab trainiertem Basismodell)

Werkzeugnutzung und Funktionsaufruf

Mistral Large 2 ist mit erweiterten Fähigkeiten zum Aufrufen und Abrufen von Funktionen ausgestattet und darauf trainiert, parallele und sequentielle Funktionsaufrufe gekonnt auszuführen kann eine leistungsstarke Engine für komplexe Geschäftsanwendungen sein. Das Bild unten zeigt den Genauigkeitsvergleich von Mistral Large 2 mit anderen Mainstream-Modellen bei Funktionsaufrufen:

Probieren Sie Mistral Large 2 aus

Benutzer können Mistral Large 2 auf La Plateforme mit dem Namen mistral-large -2407 verwenden und auf le Chat getestet. Seine Version ist 24.07 (Mistral verwendet für alle Modelle das Versionsnummerierungssystem YY.MM) und der API-Name ist mistral-large-2407.
Die Gewichte für das Anleitungsmodell werden bereitgestellt und auf HuggingFace gehostet.
Gewichtslink: https://huggingface.co/mistralai/Mistral-Large-Instruct-2407
Mistral AI integriert die Produkte auf la Plateforme in zwei allgemeine Modelle:
Mistral Nemo und Mistral Large, sowie zwei Professionelle Modelle: Codestral und Embed. Da ältere Modelle a la Plateforme auslaufen, können alle Apache-Modelle (einschließlich Mistral 7B, Mixtral 8x7B und 8x22B, Codestral Mamba, Mathstral) weiterhin mit den SDKs von Mistral AI bereitgestellt und bereitgestellt werden – Mistral-Inference und Mistral-Finetune Fine Tune.

Ab heute haben sie die Feinabstimmungsfunktionen a la Plateforme erweitert: Jetzt funktionieren sie auf Mistral Large, Mistral Nemo und Codestral. Darüber hinaus arbeitet Mistral AI mit Cloud-Dienstanbietern zusammen und Mistral Large 2 wird bald auf diesen Plattformen verfügbar sein. Mistral AI hat seine Partnerschaft mit der Google Cloud Platform erweitert, um die Modelle von Mistral AI über die Managed API auf Vertex AI zu übertragen. Mittlerweile ist es auch auf Amazon Bedrock, Azure AI Studio und IBM watsonx.ai zu finden.

Referenzlink:

https://mistral.ai/news/mistral-large-2407/

https://venturebeat.com/ai/mistral- Shocks-with-new-Open-Model-Mistral-Large-2-Taking-on-Lama-3-1/

https://techcrunch.com/2024/07/24/mistral-releases- large-2-meta-openai-ai-models/

以上が精密狙撃兵ラマ 3.1? Mistral AI オープンソース Large 2、123B は Llama 405B に相当の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。