10 行のコードで大規模モデルの数学が 20% 向上しました。「Yeluzi」の研究も Google によってテストされました。著者はすべて独学です。-ハードウェアのレビュー-php.cn

10 行のコードで大規模モデルの数学が 20% 向上しました。「Yeluzi」の研究も Google によってテストされました。著者はすべて独学です。

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

リリース： 2024-08-27 15:31:33

オリジナル

912 人が閲覧しました

10 行未満のコードで、大規模モデル (GSM8k) の数学的能力を 20% 向上させることができます。

何人かの独立した学者が大規模モデルのサンプリングの改善を提案しており、オープンソースコミュニティの注目を集めています。

現在、この手法はMistral-7Bで成果を上げており、Llama3-70Bでも試験が進行中です。

10 行代码让大模型数学提升 20%，“野路子”研究谷歌也测上了，主要作者全靠自学成才

この方法は min-p サンプリングと呼ばれ、生成されるテキストの一貫性と多様性のバランスをとることを目的としています。

簡単に言うと、事実の問題に対して安定したパフォーマンスを維持したり、執筆などのシナリオで創造的になったりするなど、モデルがさまざまな状況でさまざまな特性を発揮できるようになります。

現在、この手法はMistral-7Bで成果を上げており、Llama-70Bでのテストが始まろうとしています。

10 行代码让大模型数学提升 20%，“野路子”研究谷歌也测上了，主要作者全靠自学成才

論文の中で、著者は、この手法がオープンソースコミュニティで広く使用されていると述べました。

10 行代码让大模型数学提升 20%，“野路子”研究谷歌也测上了，主要作者全靠自学成才

同時に、著者は、Anthropic や Google などのクローズドソースモデルメーカーも min-p をテスト済み、またはテスト中であることも明らかにしました。

10 行代码让大模型数学提升 20%，“野路子”研究谷歌也测上了，主要作者全靠自学成才

このニュースは、OpenAI から Google に乗り換えた開発者コミュニティのリーダーである Logan Kilpatrick も Google によって確認されました。

10 行代码让大模型数学提升 20%，“野路子”研究谷歌也测上了，主要作者全靠自学成才

Microsoft Copilot の研究者である Abram Jackson 氏は、これを読んだ後、推論プロセスにおけるトークンサンプリングに関して初めて見た改善であり、今後も改善の余地はまだたくさんあると述べました。

10 行代码让大模型数学提升 20%，“野路子”研究谷歌也测上了，主要作者全靠自学成才

この広く注目されている研究の主著者であるミン・ナット・グエン氏は、CSを体系的に学んだことが全くなく、独学であることは言及する価値があります。

Apart Research と呼ばれる AI セキュリティ研究組織の支援を受けて、Minh とチームの他のメンバーはプロジェクトを完了しました。

10 行代码让大模型数学提升 20%，“野路子”研究谷歌也测上了，主要作者全靠自学成才

サンプリング閾値の動的調整

min-pは、動的切り捨てサンプリング方法であり、その核心は、各ステップでのトークン分布の最大確率に従って最小確率閾値をスケーリングすることです。

これの主な目的は、特に高温条件下で、生成されたテキストの一貫性と多様性のバランスをとることです。

具体的には、min-p は、サンプリングプールに入る最小確率要件を表す基本確率しきい値 p_base を導入します。

各ステップでトークンを生成するとき、min-p は p_base に現在の確率分布の最大トークン確率 p_max を乗算して、スケーリングされた絶対しきい値 p_scaled を取得します。

p_scaled 以上の確率を持つトークンのみがサンプリングプールに入ることができます。

特定のトークンに対するモデルの予測確率が非常に高い (つまり、p_max が非常に大きい) 場合、p_scaled の値も非常に高くなり、サンプリングプールが大幅に減少し、大部分の低確率トークンがフィルターされ、信頼性の高い少数のみが残されます。

10 行代码让大模型数学提升 20%，“野路子”研究谷歌也测上了，主要作者全靠自学成才

すべてのトークンに対するモデルの予測確率が比較的近い場合 (p_max が低い場合)、p_scaled の値は次のようになります。これに応じて、サンプリングプールの要件も緩和され、中確率のトークンをより多く組み込むことで、より多様なコンテンツを生成するためのより多くのスペースがモデルに与えられます。

10 行代码让大模型数学提升 20%，“野路子”研究谷歌也测上了，主要作者全靠自学成才