ViT モデルを加速する新しいアイデア! Meta は、プルーニングではなくマージに依存するトークンマージングを開始します。-AI-php.cn

トークンプルーニング: 改善されつつあるが、完全に改善されたわけではない" >トークンプルーニング: 改善されつつあるが、完全に改善されたわけではない

トークンマージング: 別のアイデア" >トークンマージング: 別のアイデア

ホームページ

テクノロジー周辺機器

ViT モデルを加速する新しいアイデア! Meta は、プルーニングではなくマージに依存するトークンマージングを開始します。

王林

Apr 12, 2023 am 10:58 AM

ai モデル

ビジュアルトランスフォーマー (ViT) は 2 年前に注目を集め、コンピュータービジョン研究の中核コンポーネントになりました。

自然言語処理の分野の Transformer モデルをコンピュータービジョンの分野に移行することに成功しました。それ以来、コンピュータービジョンの分野の進歩は加速しました。

Vanilla ViT は、コストとパフォーマンスの点で優れているにもかかわらず、依然として多くの利点を持っています。

これらは単純な行列の乗算で構成されているため、生の演算数が示すよりも高速になります。

さらに、MAE (Masked Autoencoder) などの強力な自己教師付き事前トレーニング手法もサポートしており、最先端の結果を生成できると同時に、早速トレーニング。

#データについて何の仮定もしないため、ほとんど変更せずに画像、音声、テキストなどの多くのモードに適用できます。。

もちろん、理想はとても充実していますが、現実は非常に痩せています。 ViT モデルは規模が大きく、遅延も大きくなります。リソースが限られたデバイス上でこの複雑なモデルを実行すると、非常に問題が発生する可能性があります。

トークンプルーニング: 改善されつつあるが、完全に改善されたわけではない

動作が遅いという問題に対処するために、研究者は複数の解決策が与えられます。ビジョン Transformer モデルを高速化する一般的な方法の 1 つは、トークンプルーニングを実行することです。

#実行時にトークンをプルーニングし、重要度の低いトークンをプルーニングして効率的なトランスフォーマーを生成します。たとえば、DynamicViT は冗長なトークンを階層的にプルーニングして、分類タスクの FLOP を削減します。

ただし、トークンプルーニングにはいくつかの問題があり、その中で最も重要なのは、トークンのプルーニングによって情報損失が発生することであるため、人々は ViT モデルトークンに興味を持ちません。プルーニングの数には制限があり、情報の損失を減らすために、重要でないトークンのみをプルーニングできます。

#また、プルーニングされたトークンを有効にするには、モデルを再度トレーニングする必要があります。これにより、追加のリソース消費が発生します。

#さらに重要なのは、トークンプルーニングは動的なプロセスであり、さまざまな画像や文に基づいてさまざまなトークンプルーニングの数を決定する必要があることです。これは精度を向上させるのには適していますが、この場合データをバッチ処理できなくなるため、十分実用的ではありません。

#この問題を解決するには、枝刈りプロセス中にマスクを追加する必要がありますが、これは効率の向上にさらに影響します。

# 簡単に言えば、トークンプルーニングにより ViT の実行速度は向上しますが、これには情報の損失が伴います。

トークンマージング: 別のアイデア

作り方ViT は枝刈りと同じ速度ですが、枝刈りよりも高い精度を維持しますか?メタ AI 研究チームは、トークンマージング (ToMe) という新しいソリューションを考案しました。

ViT モデルを加速する新しいアイデア! Meta は、プルーニングではなくマージに依存するトークンマージングを開始します。

# 論文リンク: https://arxiv.org/pdf/2210.09461.pdf

トークンマージでは、トークンをプルーニングするのではなく、結合することを選択します。カスタムマッチングアルゴリズムのおかげで、プルーニングと同じくらい高速でありながら、より正確です。さらに、追加のトレーニングを必要とせずに機能するため、大規模なモデルで使用して、精度を大幅に犠牲にすることなくモデルを高速化できます。

Meta の目標は、既存の ViT にトークンマージモジュールを挿入し、冗長なトークンをマージすることで追加のトレーニングを必要とせずにトレーニングと推論のスループットを向上させることです。

基本的な考え方は次のとおりです。Transformer モデルでは、マージによって各レイヤーが r 個のトークンだけ削減されます。 Transformer モデルに L 層があると仮定すると、rL トークンはマージによって削減できます。変数 r のサイズによって速度と精度の関係が決まります。これは、マーカーが少ないほど精度は低くなりますが、スループットは高くなるためです。

#トークンマージでは、画像の内容に関係なく、rL タグが削減されることに注意してください。これにより、トークンプルーニングでバッチ処理が実行できないという問題が完全に解決されます。

ToMe では、同様のトークンのバッチが各 Transformer ブロックにマージされます。たとえば、犬の毛皮は 1 つのトークンにマージされます。

ViT モデルを加速する新しいアイデア! Meta は、プルーニングではなくマージに依存するトークンマージングを開始します。

#トークンマージは、すべてのアテンションブロックとすべての Transformer ブロックに挿入されます。これは、トークンプルーニングのワークフローとも対照的です。後者では、各 Transformer ブロックの先頭に枝刈りステップが配置される傾向があります。

ViT モデルを加速する新しいアイデア! Meta は、プルーニングではなくマージに依存するトークンマージングを開始します。

#Token Merging を通じて、マージが必要なトークンの情報を広めることができ、ViT はアテンションブロックどのトークンをマージする必要があるかを決定するための特性。

具体的な方法

マージの最初のステップ類似したトークンであると判断されます。研究チームは、Transformer の QKV (クエリ、キー、値) が抽出された状態で、アブレーション実験を通じて、キーを使用することがトークン間の類似性 (下図の紫色の部分) を最もよく測定できることを発見しました。

ViT モデルを加速する新しいアイデア! Meta は、プルーニングではなくマージに依存するトークンマージングを開始します。

key は、各トークンに含まれる情報を要約して、注意点の内積に使用できるようにするためです。トークン間の類似性を測定します。

トークンの類似性を測定するのにどの指標が適しているかを検討することに加えて、類似性を測定する距離を知る必要もあります。研究チームは実験を通じて、コサイン距離を使用してトークン間の類似性を測定すると、精度と速度の最適な関係を達成できることを発見しました。

ViT モデルを加速する新しいアイデア! Meta は、プルーニングではなくマージに依存するトークンマージングを開始します。

#トークンの類似性を判断した後、合計 r を減らすためにどのトークンが一致する必要があるかを判断する簡単な方法が必要です。。

Meta チームは kmeans クラスタリングアルゴリズムやグラフセグメンテーションアルゴリズムを使用しませんが、マッチングアルゴリズムを使用します。これは、後者がトークンの数を正確に一致させることができるだけではないためです。各レイヤーで、数千の一致を迅速に実行できます。これらは、反復クラスタリングアルゴリズムでは実現できません。

# そこで、Meta チームはより効率的なソリューションを考え出しました。

#設計目標は次のとおりです。 1.) 並列化できない反復を避ける、2.) クラスタリングにはグループにマージできるマーカーの数に制限がないため (ネットワークに悪影響を与える可能性がある)、マージされた変更を段階的に行う必要があります。タグは結合されません。

ViT モデルを加速する新しいアイデア! Meta は、プルーニングではなくマージに依存するトークンマージングを開始します。

すべてのトークンを同じサイズの 2 つのセット A と B に分割します。
セット A の各トークンからセット B の最も類似したトークンまでエッジを描画します。
#最も類似した r エッジのみを残し、残りを削除します。
#まだ接続されているエッジを融合します (フィーチャは平均化されます)。
#これら 2 つのセットを結合して、最終的なマージ結果を取得します。

この独自のテクノロジーにより、ViT モデルのスループットと実際のトレーニング速度を向上させることができます。トークンマージを使用すると、トレーニング速度が 2 倍になります。画像、ビデオ、オーディオのタスクに使用でき、最先端の精度を実現します。

以上がViT モデルを加速する新しいアイデア! Meta は、プルーニングではなくマージに依存するトークンマージングを開始します。の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

このウェブサイトの声明

この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

ホットAIツール

Video Face Swap

完全無料の AI 顔交換ツールを使用して、あらゆるビデオの顔を簡単に交換できます。

ホットツール

ホットトピック

Gmailメールのログイン入り口はどこですか？

7814

Java チュートリアル

1646

CakePHP チュートリアル

1402

Laravel チュートリアル

1300

PHP チュートリアル

1238

Related knowledge

通貨サークル市場に関するリアルタイムデータの上位10の無料プラットフォーム推奨事項がリリースされます Apr 22, 2025 am 08:12 AM

初心者に適した暗号通貨データプラットフォームには、Coinmarketcapと非小さいトランペットが含まれます。 1。CoinMarketCapは、初心者と基本的な分析のニーズに合わせて、グローバルなリアルタイム価格、市場価値、取引量のランキングを提供します。 2。小さい引用は、中国のユーザーが低リスクの潜在的なプロジェクトをすばやくスクリーニングするのに適した中国フレンドリーなインターフェイスを提供します。

OKXオンラインOKX Exchange公式Webサイトオンライン Apr 22, 2025 am 06:45 AM

OKX Exchangeの詳細な紹介は次のとおりです。1）開発履歴：2017年に設立され、2022年にOKXと改名。 2）セイシェルに本社を置く。 3）ビジネススコープは、さまざまな取引製品をカバーし、350を超える暗号通貨をサポートしています。 4）ユーザーは200か国以上に広がっており、数千万人のユーザーがいます。 5）ユーザー資産を保護するために、複数のセキュリティ対策が採用されています。 6）取引手数料はマーケットメーカーモデルに基づいており、取引量の増加とともに料金率が低下します。 7）「今年の暗号通貨交換」など、多くの栄誉を獲得しました。

主要な仮想通貨取引プラットフォームのための特別なサービスのリスト Apr 22, 2025 am 08:09 AM

機関投資家は、Coinbase ProやGenesis Tradingなどの準拠したプラットフォームを選択して、コールドストレージ比と監査の透明性に焦点を当てる必要があります。小売投資家は、ユーザーのエクスペリエンスとセキュリティに焦点を当てて、BinanceやHuobiなどの大規模なプラットフォームを選択する必要があります。コンプライアンスに敏感な分野のユーザーは、サークルトレードとHuobiグローバルを通じてフィアット通貨取引を行うことができ、中国本土のユーザーは、コンプライアンスな店頭チャネルを通過する必要があります。

バルクトランザクション用の仮想通貨取引プラットフォームのトップ10の最新リリース Apr 22, 2025 am 08:18 AM

バルク取引プラットフォームを選択する際には、次の要因を考慮する必要があります。1。流動性：平均1日の取引量が50億米ドルを超えるプラットフォームに優先順位が与えられます。 2。コンプライアンス：プラットフォームが、米国のFincen、欧州連合のMICAなどのライセンスを保持しているかどうかを確認します。 3。セキュリティ：コールドウォレットの保管比と保険メカニズムが重要な指標です。 4。サービス機能：独占的なアカウントマネージャーとカスタマイズされたトランザクションツールを提供するかどうか。

複数の通貨をサポートする上位10の仮想通貨取引プラットフォームのリスト Apr 22, 2025 am 08:15 AM

OKXやCoinbaseなどの準拠プラットフォームが優先され、多要素検証が可能になり、資産の自己義が依存関係を削減できます。 2。2FAのホワイトリストをオンにし、引き出します。 3.ハードウェアウォレットまたは自立をサポートするプラットフォームを使用します。

デジタル通貨取引アプリに簡単にアクセスできるように推奨されるトップ10（最新のランキング25） Apr 22, 2025 am 07:45 AM

gate.io（グローバルバージョン）コアアドバンテージは、インターフェイスがミニマリストであり、中国語をサポートしており、フィアット通貨取引プロセスが直感的であることです。 Binance（Simpliedバージョン）コアの利点は、世界の取引量が世界で最初であり、シンプルなバージョンモデルがスポット取引のみを保持することです。 OKX（Hong Kongバージョン）コアアドバンテージは、インターフェイスがシンプルで、広東/マンダリンをサポートし、派生取引のしきい値が低いことです。 Huobi Global Station（Hong Kongバージョン）コアアドバンテージは、それが古い取引所であり、Meta-Universe Tradingターミナルを発売することです。 Kucoin（Chinese Community Edition）コアアドバンテージは、800通貨をサポートしており、インターフェイスがWeChatの相互作用を採用していることです。 Kraken（Hong Kongバージョン）コアアドバンテージは、香港SVFライセンスを保持しており、シンプルなインターフェイスを持っている古いアメリカの交換であることです。ハッシュキーエクスチェンジ（香港ライセンス）コアアドバンテージは、香港で有名な認可された取引所であり、法律を支持しています

通貨サークル2025の上位10の市場Webサイトのヒントと推奨事項 Apr 22, 2025 am 08:03 AM

国内のユーザー適応ソリューションには、コンプライアンスチャネルとローカリゼーションツールが含まれます。 1。コンプライアンスチャネル：サークルトレードなどのOTCプラットフォームを介したフランチャイズ通貨交換、国内では、香港や海外のプラットフォームを通過する必要があります。 2。ローカリゼーションツール：Currency Circleネットワークを使用して中国の情報を取得し、Huobi Global Stationはメタユニバース取引端末を提供します。

デジタル通貨交換アプリ向けのトップ10のAppleバージョンダウンロードポータルの概要 Apr 22, 2025 am 09:27 AM

さまざまな複雑な取引ツールと市場分析を提供します。 100か国以上をカバーし、1日の平均デリバティブ取引量は300億米ドルを超え、300を超える取引ペアと200倍のレバレッジをサポートし、強力な技術的強さ、巨大なグローバルユーザーベース、専門的な取引プラットフォーム、安全なストレージソリューション、豊富な取引ペアを提供します。

See all articles