Microsoft は最近、ONNX ランタイム Web に WebGPU テクノロジーを追加したことを発表しました。これは、Web ブラウザーで複雑な機械学習モデルを実行するパフォーマンスの向上に役立ちます。現在、Chrome ブラウザと Edge ブラウザは、初期段階ではありますが、このテクノロジーのサポートを開始しています。
ONNX ランタイム Web は、Web 開発者が機械学習モデルを Web ブラウザーに直接展開し、ハードウェア アクセラレーションに基づいた複数のバックエンド サポートを提供できるようにするために Microsoft によって開始された Javascript ライブラリです。 WebGPU は、機械学習モデルを Web ブラウザーでより効率的に実行するためのハードウェア アクセラレーションを提供できる、新しいネットワーク アプリケーション プログラミング インターフェイス (API) です。 これまで、Web ブラウザーのコンピューティング能力には限界があるため、Web ブラウザーでの複雑な機械学習モデル、特に大規模な生成モデルの実行効率には限界がありました。しかし、WebGPU テクノロジーの導入により、この問題は解決されることが期待されています。 WebGPU はデバイス GPU の能力を解放し、これらの複雑な機械学習モデルを Web ブラウザーで効率的に実行できるようにし、パフォーマンスを大幅に向上させます。
編集者の理解によれば、Microsoft は、WebGPU はコンピューティング シェーダーなどの高度な機能を利用して、より効率的な方法で複雑な機械学習ワークロードを処理できると述べています。さらに、WebGPU の半精度 (FP16) のサポートにより、GPU メモリの使用量と帯域幅要件も削減され、コンピューティングがさらに高速化されます。これらの最適化により、WebGPU は、より効率的でスケーラブルな機械学習アプリケーションを Web ブラウザーで直接推論することが期待されています。
現在、Mac、Windows、ChromeOS、Android 版 Chrome 113 および Edge 113 121 WebGPU サポートはデフォルトで含まれています。これは、開発者が ONNX ランタイムを試すことができることを意味します Web は、WebGPU アクセラレーション リソースを呼び出して、Web ブラウザーでの機械学習モデルの実行パフォーマンスを向上させます。このテクノロジーは開発と改善を続けるため、将来的には、より効率的で便利な機械学習アプリケーションが Web ブラウザーに実装されることが期待されます。
以上がONNX ランタイム Web が WebGPU を導入: Web ブラウザーでの機械学習のパフォーマンスが飛躍的に向上の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。