目次
デジタル エンコーディングにおける新たなブレークスルー
xVal: 連続数値エンコーディング
数値推論
実験部分
ホームページ テクノロジー周辺機器 AI 1 トークンで LLM デジタル コーディングの問題が解決します。主要9機関が共同リリースしたxVal:トレーニングセットに含まれない数値も予測可能!

1 トークンで LLM デジタル コーディングの問題が解決します。主要9機関が共同リリースしたxVal:トレーニングセットに含まれない数値も予測可能!

Oct 19, 2023 pm 02:25 PM
ai

大規模言語モデル (LLM) のパフォーマンスは、テキスト分析および生成タスクでは非常に強力ですが、複数桁の乗算などの数値を含む問題に直面した場合、統一された完全な数値が内部に存在しないため、モデル 単語分割メカニズムにより、LLM は数値の意味を理解できなくなり、ランダムな回答を作成できなくなります。

現在、LLM が科学分野のデータ分析に広く使用されていない大きな障害の 1 つは、デジタル エンコーディングの問題です。

最近、フラットアイアン研究所、ローレンス・バークレー国立研究所、ケンブリッジ大学、ニューヨーク大学、プリンストン大学を含む9つの研究機関が共同で、たった1つのトークンである新しいデジタル符号化スキームxValをリリースしました。すべての数値をエンコードするために必要です。

1 トークンで LLM デジタル コーディングの問題が解決します。主要9機関が共同リリースしたxVal:トレーニングセットに含まれない数値も予測可能!

論文リンク: https://arxiv.org/pdf/2310.02989.pdf

xVal xVal 戦略は、ターゲットの真の値を表す専用トークン ([NUM]) の埋め込みベクトルを数値的にスケーリングし、修正された数値推論方法と組み合わせることで、モデルを入力文字列数値から出力数値にエンドツーエンドでマッピングできるようにします。連続的で、科学分野でのアプリケーションにより適しています。

合成データセットと現実世界のデータセットの評価結果は、xVal が既存の数値エンコード スキームよりも優れたパフォーマンスとトークン効率を実現するだけでなく、より優れた内挿も示すことを示しています。

デジタル エンコーディングにおける新たなブレークスルー

標準の LLM 単語分割スキームでは数値と​​テキストが区別されないため、値を定量化することは不可能です。

これまでの研究では、10 を基数として使用したり、数値の埋め込み間で計算したりして、科学表記法の形式ですべての数値を限られたプロトタイプ数値のセットにマッピングしました。数値自体の数値的な違いを反映しており、行列の乗算などの線形代数の問題を解決するためにうまく使用されています。

ただし、科学分野の連続問題や滑らかな問題の場合、言語モデルは依然として補間問題や分布外汎化問題をうまく処理できません。これは、数値をテキストにエンコードした後、LLM が処理するためです。そして、デコード段階は依然として本質的に離散的であり、連続関数を近似する方法を学習するのは困難です。

xVal のアイデアは、数値サイズを乗算的にエンコードし、埋め込み空間で学習可能な方向に向けることで、Transformer アーキテクチャの処理と解釈を大幅に変更します。

xVal は数値エンコードに単一のトークンを使用します。これには、トークンの効率性と語彙のフットプリントが最小限に抑えられるという利点があります。

修正された数値推論パラダイムと組み合わせると、入力数値と出力文字列数値の間のマッピングが連続 (滑らか) であり、近似関数が連続である場合、Transformer モデルの値は連続 (滑らか) になります。あるいは、平滑化により誘導バイアスを改善することもできます。

xVal: 連続数値エンコーディング

xVal は、異なる数値に対して異なるトークンを使用せず、埋め込み空間内の特定の学習可能な方向に沿って値を直接埋め込みます。

1 トークンで LLM デジタル コーディングの問題が解決します。主要9機関が共同リリースしたxVal:トレーニングセットに含まれない数値も予測可能!

入力文字列に数値とテキストの両方が含まれていると仮定すると、システムはまず入力を解析し、すべての値を抽出してから、A を構築します。数値が [NUM] プレースホルダーで置き換えられ、[NUM] の埋め込みベクトルが対応する数値で乗算された新しい文字列。

エンコード プロセス全体は、マスク言語モデリング (MLM) および自己回帰 (AR) 生成に使用できます。

層正規化に基づく層ノルムによる暗黙的な正規化

特定の実装では、最初に各 Transformer ブロックに xVal を乗算埋め込んだ後、入力サンプルに基づいて各トークンの埋め込みを正規化するには、位置エンコード ベクトルとレイヤー正規化 (レイヤー ノルム) を追加する必要があります。

位置の埋め込みが [NUM] タグの埋め込みと同一線上にない場合、スカラー値を非線形再スケーリング関数 (非線形再スケーリング) に渡すことができます。

u は [NUM] の埋め込み、p は位置の埋め込み、x はエンコードされたスカラー値であると仮定します。計算を簡素化するために、u · p=0 と仮定できます。 ∥u∥ =∥p∥ = 1 の場合、

を取得できます。

1 トークンで LLM デジタル コーディングの問題が解決します。主要9機関が共同リリースしたxVal:トレーニングセットに含まれない数値も予測可能!

つまり、x の値は u と同じ方向にエンコードされ、この属性はトレーニング後も維持できます。

1 トークンで LLM デジタル コーディングの問題が解決します。主要9機関が共同リリースしたxVal:トレーニングセットに含まれない数値も予測可能!

この正規化特性は、xVal のダイナミック レンジが他のテキストベースのエンコーディング スキームのダイナミック レンジよりも小さいことを意味します。 -5, 5] をトレーニング前の前処理ステップとして使用します。

数値推論

xVal は入力値への連続埋め込みを定義しますが、多分類タスクが出力およびトレーニング アルゴリズムとして使用される場合は、入力値と出力値の間のマッピングでは、モデル全体がエンドツーエンド連続ではないため、数値は出力層で個別に処理する必要があります。

1 トークンで LLM デジタル コーディングの問題が解決します。主要9機関が共同リリースしたxVal:トレーニングセットに含まれない数値も予測可能!

Transformer 言語モデルの標準的な実践に従って、研究者たちは語彙トークンの確率分布を出力するトークンヘッドを定義しました。

xVal は [NUM] を使用して数値を置き換えるため、ヘッドには数値に関する情報が含まれないため、平均値を介してスカラー出力を持つ新しい数値ヘッドを導入する必要があります。二乗誤差 (MSE) 損失は、[NUM] に関連付けられた特定の数値を回復するようにトレーニングされます。

入力を与えた後、まずトークンの先頭の出力を観察します。生成されたトークンが [NUM] の場合は、数字の先頭を見てトークンの値を入力します。

実験では、Transformer モデルは値を推論するときにエンドツーエンドで連続的であるため、目に見えない値を補間するときにパフォーマンスが向上します。

実験部分

他のデジタル符号化方式との比較

研究者らは、次のようなパフォーマンスを比較しました。 XVAL と他の 4 つのデジタル エンコーディングを比較しました。これらのメソッドはすべて、最初に数値を ±ddd E±d の形式に処理し、次に形式に従って 1 つまたは複数のトークンを呼び出してエンコーディングを決定する必要があります。

1 トークンで LLM デジタル コーディングの問題が解決します。主要9機関が共同リリースしたxVal:トレーニングセットに含まれない数値も予測可能!

メソッドが異なると、各数値をエンコードするために必要なトークンと語彙の数が大きく異なりますが、全体としては、xVal のエンコード効率が最も高く、語彙も豊富です。サイズは一番小さいです。

研究者らはまた、合成算術演算データ、地球温度データ、惑星軌道シミュレーション データを含む 3 つのデータセットで xVal を評価しました。

算術の学習

最大規模の LLM であっても、「複数桁の乗算」は依然として非常に困難なタスクです。 GPT-4 などのゼロショット精度は、3 桁の乗算問題で 59% しか達成できず、4 桁および 5 桁の乗算問題でさえ 4% と 0% の精度しか達成できません。

1 トークンで LLM デジタル コーディングの問題が解決します。主要9機関が共同リリースしたxVal:トレーニングセットに含まれない数値も予測可能!

比較実験によると、他のデジタル エンコーディングは通常、複数桁の乗算問題をうまく解決できますが、xVal の予測結果は P10 および FP15 と比較するとより安定しており、そうではありません。異常な予測値が生成されます。

タスクの難易度を改善するために、研究者らはランダムな二分木を使用して、加算、減算、および加算の二項演算子を使用して固定数のオペランド (2、3、または 4) を構築しました。乗算: 各サンプルが ((1.32 * 32.1) (1.42-8.20)) = 35.592

のような算術式であり、各数値のエンコード スキームに基づくデータ セット。処理にはサンプルの処理が必要で、タスクの目標は方程式の左側の式、つまり方程式の右側がマスクである式を計算することです。

結果から判断すると、xVal はこのタスクで非常にうまく機能しましたが、算術実験だけでは言語モデルの数学的機能を完全に評価するには十分ではありません。これは、算術演算のサンプルは通常短いシーケンスであり、その基礎となるものであるためです。データ フロー 形状が低次元であるため、これらの問題は LLM の計算ボトルネックを突破できず、現実世界のアプリケーションはより複雑です。

気温予測

研究者らは、ERA5 地球規模気候データセットのサブセットを使用しました。評価では、簡単にするために、実験では表面温度データ (ERA5 の T2m) のみに焦点を当て、サンプルを分割します。各サンプルには 2 ~ 4 日の表面温度データ (正規化後の単位分散あり) と 60 日分のデータが含まれます。 - ランダムに選択された 90 個のレポートステーションの緯度と経度。

緯度のサインと経度のサインとコサインをエンコードして、データの周期性を維持し、同じ操作を使用して位置をエンコードします。 24 時間 365 日の期間。

1 トークンで LLM デジタル コーディングの問題が解決します。主要9機関が共同リリースしたxVal:トレーニングセットに含まれない数値も予測可能!

座標、開始およびデータは、レポート ステーションの座標、最初のサンプルの時間、および正規化された温度データに対応し、MLM メソッドを使用してトレーニングします。言語モデル。

1 トークンで LLM デジタル コーディングの問題が解決します。主要9機関が共同リリースしたxVal:トレーニングセットに含まれない数値も予測可能!

結果から、xVal が最高のパフォーマンスを示し、計算時間も大幅に短縮されました。

1 トークンで LLM デジタル コーディングの問題が解決します。主要9機関が共同リリースしたxVal:トレーニングセットに含まれない数値も予測可能!

このタスクでは、テキスト ベースのエンコード スキームの欠点も説明します。モデルは、データ内の偽の相関、つまり P10、P1000、および P1000 を悪用する可能性があります。 B1999 正規化温度 ±0.1 を予測する傾向があります。これは主に、この数値がデータセット内で最も頻繁に現れるためです。

1 トークンで LLM デジタル コーディングの問題が解決します。主要9機関が共同リリースしたxVal:トレーニングセットに含まれない数値も予測可能!

P1000 スキームと P10 スキームの場合、2 つのスキームの平均エンコード出力はそれぞれ約 8000 トークンと 5000 トークンです (比較すると、FP15 と xVal平均約 1800 トークン)、モデルのパフォーマンスの低下は、長距離モデリングの問題が原因である可能性があります。

以上が1 トークンで LLM デジタル コーディングの問題が解決します。主要9機関が共同リリースしたxVal:トレーニングセットに含まれない数値も予測可能!の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

ホットAIツール

Undresser.AI Undress

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

Undress AI Tool

脱衣画像を無料で

Clothoff.io

Clothoff.io

AI衣類リムーバー

AI Hentai Generator

AI Hentai Generator

AIヘンタイを無料で生成します。

ホットツール

メモ帳++7.3.1

メモ帳++7.3.1

使いやすく無料のコードエディター

SublimeText3 中国語版

SublimeText3 中国語版

中国語版、とても使いやすい

ゼンドスタジオ 13.0.1

ゼンドスタジオ 13.0.1

強力な PHP 統合開発環境

ドリームウィーバー CS6

ドリームウィーバー CS6

ビジュアル Web 開発ツール

SublimeText3 Mac版

SublimeText3 Mac版

神レベルのコード編集ソフト(SublimeText3)

MySQLを解決する方法は開始できません MySQLを解決する方法は開始できません Apr 08, 2025 pm 02:21 PM

MySQLの起動が失敗する理由はたくさんあり、エラーログをチェックすることで診断できます。一般的な原因には、ポートの競合(ポート占有率をチェックして構成の変更)、許可の問題(ユーザー許可を実行するサービスを確認)、構成ファイルエラー(パラメーター設定のチェック)、データディレクトリの破損(テーブルスペースの復元)、INNODBテーブルスペースの問題(IBDATA1ファイルのチェック)、プラグインロード障害(エラーログのチェック)が含まれます。問題を解決するときは、エラーログに基づいてそれらを分析し、問題の根本原因を見つけ、問題を防ぐために定期的にデータをバックアップする習慣を開発する必要があります。

mysqlはjsonを返すことができますか mysqlはjsonを返すことができますか Apr 08, 2025 pm 03:09 PM

MySQLはJSONデータを返すことができます。 json_extract関数はフィールド値を抽出します。複雑なクエリについては、Where句を使用してJSONデータをフィルタリングすることを検討できますが、そのパフォーマンスへの影響に注意してください。 JSONに対するMySQLのサポートは絶えず増加しており、最新バージョンと機能に注意を払うことをお勧めします。

酸性特性を理解する:信頼できるデータベースの柱 酸性特性を理解する:信頼できるデータベースの柱 Apr 08, 2025 pm 06:33 PM

データベース酸属性の詳細な説明酸属性は、データベーストランザクションの信頼性と一貫性を確保するための一連のルールです。データベースシステムがトランザクションを処理する方法を定義し、システムのクラッシュ、停電、または複数のユーザーの同時アクセスの場合でも、データの整合性と精度を確保します。酸属性の概要原子性:トランザクションは不可分な単位と見なされます。どの部分も失敗し、トランザクション全体がロールバックされ、データベースは変更を保持しません。たとえば、銀行の譲渡が1つのアカウントから控除されているが別のア​​カウントに増加しない場合、操作全体が取り消されます。 TRANSACTION; updateaccountssetbalance = balance-100wh

マスターSQL制限条項:クエリの行数を制御する マスターSQL制限条項:クエリの行数を制御する Apr 08, 2025 pm 07:00 PM

sqllimit句:クエリ結果の行数を制御します。 SQLの制限条項は、クエリによって返される行数を制限するために使用されます。これは、大規模なデータセット、パジネートされたディスプレイ、テストデータを処理する場合に非常に便利であり、クエリ効率を効果的に改善することができます。構文の基本的な構文:SelectColumn1、column2、... FromTable_nameLimitnumber_of_rows; number_of_rows:返された行の数を指定します。オフセットの構文:SelectColumn1、column2、... FromTable_nameLimitoffset、number_of_rows; offset:skip

高負荷アプリケーションのMySQLパフォーマンスを最適化する方法は? 高負荷アプリケーションのMySQLパフォーマンスを最適化する方法は? Apr 08, 2025 pm 06:03 PM

MySQLデータベースパフォーマンス最適化ガイドリソース集約型アプリケーションでは、MySQLデータベースが重要な役割を果たし、大規模なトランザクションの管理を担当しています。ただし、アプリケーションのスケールが拡大すると、データベースパフォーマンスのボトルネックが制約になることがよくあります。この記事では、一連の効果的なMySQLパフォーマンス最適化戦略を検討して、アプリケーションが高負荷の下で効率的で応答性の高いままであることを保証します。実際のケースを組み合わせて、インデックス作成、クエリ最適化、データベース設計、キャッシュなどの詳細な主要なテクノロジーを説明します。 1.データベースアーキテクチャの設計と最適化されたデータベースアーキテクチャは、MySQLパフォーマンスの最適化の基礎です。いくつかのコア原則は次のとおりです。適切なデータ型を選択し、ニーズを満たす最小のデータ型を選択すると、ストレージスペースを節約するだけでなく、データ処理速度を向上させることもできます。

MongoDBデータベースパスワードを表示するNAVICATの方法 MongoDBデータベースパスワードを表示するNAVICATの方法 Apr 08, 2025 pm 09:39 PM

Hash値として保存されているため、Navicatを介してMongoDBパスワードを直接表示することは不可能です。紛失したパスワードを取得する方法:1。パスワードのリセット。 2。構成ファイルを確認します(ハッシュ値が含まれる場合があります)。 3.コードを確認します(パスワードをハードコードできます)。

MySQLの主な鍵はヌルにすることができます MySQLの主な鍵はヌルにすることができます Apr 08, 2025 pm 03:03 PM

MySQLプライマリキーは、データベース内の各行を一意に識別するキー属性であるため、空にすることはできません。主キーが空になる可能性がある場合、レコードを一意に識別することはできません。これにより、データの混乱が発生します。一次キーとして自己挿入整数列またはUUIDを使用する場合、効率やスペース占有などの要因を考慮し、適切なソリューションを選択する必要があります。

Prometheus MySQL ExporterでMySQLおよびMariadb液滴を監視します Prometheus MySQL ExporterでMySQLおよびMariadb液滴を監視します Apr 08, 2025 pm 02:42 PM

MySQLおよびMariaDBデータベースの効果的な監視は、最適なパフォーマンスを維持し、潜在的なボトルネックを特定し、システム全体の信頼性を確保するために重要です。 Prometheus MySQL Exporterは、プロアクティブな管理とトラブルシューティングに重要なデータベースメトリックに関する詳細な洞察を提供する強力なツールです。

See all articles