ミストラルミディアムが誤って漏洩した?リストに載ったこの謎のモデルは、AI コミュニティで多くの議論を引き起こしました。
Feb 01, 2024 am 10:30 AM「私は今、Miqu と Perplexity Labs の Mistral-Medium が同じモデルであると 100% 確信しています。」
最近、「Mistral-Medium モデルの漏洩」に関するニュースがみんなの関心を集めました。注意。
噂によると、「Miqu」と呼ばれる新しいモデルに関するリークニュースは、言語モデルの心の知能指数を評価するためのベンチマークであるEQ-Benchに関連しているそうです。関連データによると、EQ-Bench と MMLU の相関は約 0.97、Arena Elo との相関は約 0.94 です。興味深いことに、このベンチマーク評価では、Miqu が GPT-4 を除くすべての大型モデルを直接上回り、そのスコアは Mistral-Medium に非常に近くなっています。このニュースは幅広い注目と議論を呼びました。
画像ソース: https://x.com/N8Programs/status/1752441060133892503?s=20
オープンソースのアドレス: https://huggingface.co/miqudev/miqu-1-70b
このような強力なモデルの場合、プロジェクトの発行者は謎の人物です:
誰かが「誰があなたを作ったのか」と尋ねたので、ミクは直接報告しました:「私はミストラル アル チームによって作成されました。」
- 情報を提供する前に、ドイツ語でモデルに次のように指示します。「いくつかの情報を提供します。この情報に注意してください」ただし、理解したことを確認するために「OK」を使用してください。それ以外は何も言わないでください。」 これは、モデルが命令を理解し実行する能力をテストするためです。
- トピックに関するすべての情報を提供した後、モデルに質問します。これは多肢選択問題 (A/B/C) で、最初と最後の質問は同じですが、選択肢の順序と文字 (X/Y/Z) が変更されています。各テストには 4 ~ 6 問、合計 18 問の多肢選択問題が含まれています。
- モデルによる正解数に基づくランキング。最初はコース情報を提供した後に回答を検討し、2 番目は事前に情報を提供せずに盲目的に回答します。同点の場合の回答です。すべてのテストは独立したユニットであり、コンテキストは各テスト間でクリアされ、セッション間ではメモリや状態は保持されません。
ただし、この開発者のテストでは、Miqu のパフォーマンスは Mixtral-8x7B-Instruct-v0.1 (4 ビット) よりも悪く、それでも Mistral Small および Medium よりは優れていました。ただし、Mixtral 8x7B Instruct よりも優れているわけではありません。開発者は、Miqu が漏洩した MistralAI モデル、おそらく古い概念実証モデルである可能性があると推測しています。
これは、これまでに確認した中で 2 番目の主張を裏付ける最も詳細なテストです。
しかし、一部の開発者は、Miqu は MistralAI とは何の関係もなく、むしろ Llama 70B に似ていると信じています。そのアーキテクチャは Llama 70B と「まったく同じ」であり、「専門的なハイブリッド モデルではない」からです。
同様に、テストを行った結果、Miqu が実際にはラマに似ていることがわかった人もいます。
しかし、スコア差 ほら、Miqu と Llama 70B は明らかに同じモデルではありません。
つまり、Miqu は Llama の微調整されたバージョンであるか、Mistral-Medium の初期バージョンであると誰かが結論付けました:
前者が真の場合、Miqu は Mistral-Medium データセットで微調整された Llama 70B である可能性があります:
後者が真の場合、Miqu はミストラル API を抽出しただけですが、おそらく「米国が月面着陸を捏造した」レベルの茶番劇になるでしょう:
#最後の質問、誰ですか漏洩者?
多くの X プラットフォーム ユーザーから提供された手がかりによると、流出した疑いのあるモデルはもともと 4chan と呼ばれる Web サイトに投稿されたものです。この Web サイトは完全に匿名のリアルタイム メッセージング フォーラムで、ユーザーは登録せずにグラフィックやテキストのコメントを投稿できます。
参考リンク: https://www.reddit.com/r/LocalLLaMA/comments/1af4fbg/llm_comparisontest_miqu170b/
以上がミストラルミディアムが誤って漏洩した?リストに載ったこの謎のモデルは、AI コミュニティで多くの議論を引き起こしました。の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

人気の記事

人気の記事

ホットな記事タグ

メモ帳++7.3.1
使いやすく無料のコードエディター

SublimeText3 中国語版
中国語版、とても使いやすい

ゼンドスタジオ 13.0.1
強力な PHP 統合開発環境

ドリームウィーバー CS6
ビジュアル Web 開発ツール

SublimeText3 Mac版
神レベルのコード編集ソフト(SublimeText3)

ホットトピック











DeepMind ロボットが卓球をすると、フォアハンドとバックハンドが空中に滑り出し、人間の初心者を完全に打ち負かしました

クロードも怠け者になってしまった!ネチズン: 自分に休日を与える方法を学びましょう

初のメカニカルクロー!元羅宝は2024年の世界ロボット会議に登場し、家庭に入ることができる初のチェスロボットを発表した

世界ロボット会議で「未来の高齢者介護の希望」を担う家庭用ロボットを囲みました

宏蒙スマートトラベルS9とフルシナリオ新製品発売カンファレンス、多数の大ヒット新製品が一緒にリリースされました

Li Feifei 氏のチームは、ロボットに空間知能を与え、GPT-4o を統合する ReKep を提案しました

ACL 2024 賞の発表: HuaTech による Oracle 解読に関する最優秀論文の 1 つ、GloVe Time Test Award

中国初の大型UIモデル登場! Motiff の大規模モデルはデザイナーにとって最適なアシスタントを作成し、UI デザインのワークフローを最適化します
