目次
物理ディープラーニング
ホームページ テクノロジー周辺機器 AI 生物学にヒントを得たトレーニング方法を使用した物理ディープラーニング: 物理ハードウェアへの勾配のないアプローチ

生物学にヒントを得たトレーニング方法を使用した物理ディープラーニング: 物理ハードウェアへの勾配のないアプローチ

Apr 12, 2023 am 09:04 AM
ニューラルネットワーク 電車

人工知能に対する需要の高まりにより、物理デバイスに基づく型破りなコンピューティングの研究が推進されています。このようなコンピューティング デバイスは脳にヒントを得たアナログ情報処理を模倣していますが、学習プロセスは依然としてバックプロパゲーションなどの数値処理に最適化された方法に依存しており、物理的な実装には適していません。

日本の NTT デバイス技術研究所 (NTT デバイス技術研究所) と東京大学の研究チームは、ダイレクト フィードバック アライメント (DFA) と呼ばれる手法を拡張しました。物理的な深層学習を実証するためのトレーニング アルゴリズム。 元のアルゴリズムとは異なり、提案された方法は、代替の非線形活性化を伴うランダムな投影に基づいています。したがって、物理ニューラル ネットワークは、物理システムとその勾配についての知識がなくてもトレーニングできます。さらに、このトレーニングの計算は、スケーラブルな物理ハードウェア上でシミュレートできます。

研究者らは、ディープ・リザーバー・コンピューターと呼ばれる光電子リカレント・ニューラル・ネットワークを使用した概念実証を実証しました。ベンチマークで競争力のあるパフォーマンスを備えた高速コンピューティングの可能性が実証されています。その結果は、ニューロモーフィック コンピューティングのトレーニングと高速化のための実用的なソリューションを提供します。

研究のタイトルは「生物学的にインスピレーションを得たトレーニング手法を使用した物理ディープラーニング: 物理ハードウェアに対する勾配のないアプローチ」で、2022 年 12 月 26 日に「」でリリースされました。 ネイチャーコミュニケーションズ」。

物理ディープラーニング

画像処理、音声認識、ゲームなどにおける人工ニューラル ネットワーク (ANN) ベースの機械学習の記録破りのパフォーマンスに成功その卓越した能力を発揮した。これらのアルゴリズムは人間の脳の仕組みに似ていますが、基本的には従来のフォン ノイマン コンピューティング ハードウェアを使用してソフトウェア レベルで実装されます。しかし、このようなデジタルコンピューティングベースの人工ニューラルネットワークは、エネルギー消費と処理速度の点で問題を抱えています。これらの問題は、人工ニューラル ネットワークの実装に代替の物理プラットフォームを使用する動機となります。

興味深いことに、受動的な物理ダイナミクスであっても、ランダムに接続された ANN の計算リソースとして使用できます。物理リザーバー コンピューター (RC) またはエクストリーム ラーニング マシン (ELM) として知られるこのフレームワークの実装の容易さにより、実現可能な材料の選択肢とそのアプリケーションの範囲が大幅に広がります。このように物理的に実装されたニューラル ネットワーク (PNN) は、タスク固有の計算負荷を物理システムにアウトソーシングできます。

より深い物理ネットワークを構築することは、ネットワーク表現力を飛躍的に拡張できるため、パフォーマンスをさらに向上させるための有望な方向性です。これにより、さまざまな物理プラットフォームを使用したディープ PNN の提案が動機付けられます。彼らのトレーニングは基本的に、ソフトウェアベースの ANN で大きな成功を収めているバックプロパゲーション (BP) と呼ばれる方法に依存しています。ただし、BP は次の点で PNN には適していません。まず、BP 操作の物理的な実装は依然として複雑であり、スケーラブルではありません。第二に、BP では物理システム全体を正確に理解する必要があります。さらに、BP を RC に適用すると、これらの要件は物理 RC の固有の特性、つまりブラックボックスの物理確率ネットワークを正確に理解してシミュレートする必要があるという特性を損なうことになります。

PNN における BP と同様に、生物学的ニューラル ネットワークにおける BP の操作の難しさは脳科学コミュニティによって指摘されており、脳における BP の合理性は常に疑問視されてきました。これらの考慮事項は、生物学的に健全なトレーニング アルゴリズムの開発につながりました。

最近の有望な方向性は、ダイレクト フィードバック アライメント (DFA) です。このアルゴリズムでは、最終出力層エラー信号の固定ランダム線形変換を使用して、逆エラー信号を置き換えます。したがって、この方法はエラー信号の層ごとの伝播や重みの知識を必要としません。さらに、DFA は最新の大規模ネットワーク モデルに拡張可能であると報告されています。この生物学的に動機付けられたトレーニングの成功は、BP よりも PNN をトレーニングするのに適した方法があることを示唆しています。ただし、DFA は依然としてトレーニングのために非線形関数 f(x) の導関数 f'(a) を必要とするため、物理システムへの DFA 法の適用が妨げられます。したがって、DFA のより大きなスケーリングは PNN アプリケーションにとって重要です。

DFA と物理学におけるディープ ラーニングの強化

ここでは、研究者が DFA アルゴリズムを強化することによって物理学におけるディープ ラーニングを実証しています。強化された DFA では、標準 DFA の物理的非線形活性化 f'(a) の導関数を任意の非線形 g(a) に置き換え、パフォーマンスが g(a) の選択に対してロバストであることを示します。この機能強化により、f'(a) を正確にモデル化する必要がなくなりました。提案された方法は、任意の非線形活性化を伴う並列確率的投影に基づいているため、物理的な ELM または RC の概念と同じ方法で物理システム上でトレーニング計算を実行できます。これにより、推論とトレーニングの物理的な高速化が可能になります。

生物学にヒントを得たトレーニング方法を使用した物理ディープラーニング: 物理ハードウェアへの勾配のないアプローチ

#図: PNN の概念と、BP および拡張 DFA によるトレーニング。 (出典: 論文)

#概念実証を実証するために、研究者らは FPGA 支援の光電子ディープ物理 RC をワークベンチとして構築しました。ベンチトップは使いやすく、ソフトウェア レベルのアップデートのみでさまざまな物理プラットフォームに適用できますが、大規模で複雑な最先端のシステムに匹敵するパフォーマンスを実現します。

生物学にヒントを得たトレーニング方法を使用した物理ディープラーニング: 物理ハードウェアへの勾配のないアプローチ

図: DFA トレーニングが強化されたオプトエレクトロニクス深度 RC システム。 (出典:論文)

# また、デジタル処理時間を含めた全体の処理時間を比較し、トレーニングプロセスの物理的な高速化の可能性を検討した。見つかった。

生物学にヒントを得たトレーニング方法を使用した物理ディープラーニング: 物理ハードウェアへの勾配のないアプローチ

#図: 光電子ディープ RC システムの性能。 (出典: 論文)

RC ベンチの処理時間の予算の内訳は次のとおりです: FPGA 処理 (データ転送、メモリ割り当て、および DAC/ADC) ~92% ; デジタル処理の 8% は前処理/後処理に使用されます。したがって、現段階では、FPGA と CPU での数値計算が処理時間の大部分を占めています。これは、オプトエレクトロニクス ベンチが非線形遅延線のみを使用して 1 つのリザーバーを実装しているためであり、これらの制限は、将来的には完全に並列で全光学式のコンピューティング ハードウェアを使用することで緩和される可能性があります。見てわかるように、CPU と GPU での計算ではノード数が O(N^2) の傾向を示していますが、ベンチトップでは O(N) を示していますが、これはデータ転送のボトルネックが原因です。

CPU 外部の物理的加速度は、BP アルゴリズムと拡張 DFA アルゴリズムでそれぞれ N ~5,000 と ~12,000 で観察されます。ただし、計算速度の点では、GPU のメモリ制限のため、GPU に対する有効性は直接観察されていません。 GPU の傾向を推定すると、N ~80,000 で GPU を超える物理速度の向上が観察されます。私たちの知る限り、これはトレーニング プロセス全体の最初の比較であり、PNN を使用したフィジカル トレーニングの高速化の最初のデモンストレーションです。

提案された方法の他のシステムへの適用可能性を検討するために、広く研究されているフォトニック ニューラル ネットワークを使用して数値シミュレーションを実行しました。さらに、実験的に実証された遅延ベースの RC は、さまざまな物理システムに適していることが示されています。物理システムのスケーラビリティに関して、深いネットワークを構築する際の主な問題は、固有のノイズです。ノイズの影響は数値シミュレーションによって研究されます。このシステムはノイズに対して強いことが判明しました。

提案されたアプローチのスケーラビリティと制限

ここでは、より最新のモデルに対する DFA ベースのアプローチのスケーラビリティについて検討します。実用的な深層学習に最も一般的に使用されるモデルの 1 つは、深層接続畳み込みニューラル ネットワーク (CNN) です。ただし、DFA アルゴリズムを標準の CNN に適用するのは難しいことが報告されています。したがって、提案された方法を単純な方法で畳み込み PNN に適用することは困難である可能性があります。

SNN への適合性も、シミュレーション ハードウェアの実装を考慮した重要なトピックです。 DFA ベースのトレーニングの SNN への適用可能性が報告されており、これは、この研究で提案された強化された DFA によりトレーニングが容易になる可能性があることを意味します。

DFA ベースのアルゴリズムは、単純な MLP や RC よりも実用的なモデルに拡張できる可能性がありますが、DFA ベースのトレーニングをそのようなネットワークに適用する有効性はまだ不明です。ここでは、この研究の追加作業として、上記のモデル (MLP-Mixer、Vision transformer (ViT)、ResNet、および SNN) に対する DFA ベースのトレーニング (DFA 自体および拡張 DFA) のスケーラビリティを調査します。 DFA ベースのトレーニングは、探索的な実践モデルに対しても効果的であることがわかりました。 DFA ベースのトレーニングで達成できる精度は本質的に BP トレーニングの精度よりも低いですが、モデルやアルゴリズムを調整することでパフォーマンスを向上させることができます。特に、DFA と強化された DFA の精度は、調査したすべての実験設定で同等であり、DFA 自体のさらなる改善が強化された DFA の改善に直接貢献することを示唆しています。結果は、この方法が単純な MLP モデルや RC モデルだけでなく、PNN の実用的なモデルの将来の実装にも拡張できることを示しています。

表 1: 拡張 DFA の実際のネットワーク モデルへの適用性。 (出典: 論文)

生物学にヒントを得たトレーニング方法を使用した物理ディープラーニング: 物理ハードウェアへの勾配のないアプローチ

物理ハードウェアにおける BP と DFA

一般的には、次のように言えます。 BP は計算グラフ内のすべての情報を必要とするため、物理ハードウェアに実装するのは非常に困難です。したがって、物理ハードウェアでのトレーニングは常に計算シミュレーションを通じて行われており、これには多額の計算コストがかかります。さらに、モデルと実際のシステムとの差異により精度が低下します。対照的に、拡張 DFA では、物理システムに関する正確な事前知識は必要ありません。したがって、ディープ PNN では、精度の点で、DFA ベースの方法が BP ベースの方法よりも効果的です。さらに、物理ハードウェアを使用して計算を高速化することもできます。

さらに、DFA トレーニングでは、レイヤーごとに計算される逐次的なエラー伝播は必要ありません。これは、各レイヤーのトレーニングを並行して実行できることを意味します。したがって、より最適化された並列 DFA 実装は、より大幅な高速化につながる可能性があります。これらの独自の特性は、特に物理ハードウェアに基づくニューラル ネットワークに対する DFA ベースの手法の有効性を示しています。一方で、強化された DFA トレーニング済みモデルの精度は、BP トレーニング済みモデルの精度よりもまだ劣っています。 DFA ベースのトレーニングの精度をさらに向上させることは今後の課題です。

さらなる物理の高速化

物理実装では、ノード数が大きい場合の RC ループ処理の高速化を示します。ただし、その利点はまだ限られており、さらなる改善が必要です。現在のプロトタイプの処理時間は、FPGA へのデータ転送とメモリ割り当てとして表されます。したがって、すべてのプロセスを FPGA に統合すると、実験の柔軟性を犠牲にしてパフォーマンスが大幅に向上します。さらに、将来的には、航空光学方式により伝送コストが大幅に削減されるでしょう。大規模な光集積化とオンチップ集積化により、光コンピューティング自体のパフォーマンスがさらに向上します。

以上が生物学にヒントを得たトレーニング方法を使用した物理ディープラーニング: 物理ハードウェアへの勾配のないアプローチの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

ホットAIツール

Undresser.AI Undress

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

Undress AI Tool

脱衣画像を無料で

Clothoff.io

Clothoff.io

AI衣類リムーバー

AI Hentai Generator

AI Hentai Generator

AIヘンタイを無料で生成します。

ホットツール

メモ帳++7.3.1

メモ帳++7.3.1

使いやすく無料のコードエディター

SublimeText3 中国語版

SublimeText3 中国語版

中国語版、とても使いやすい

ゼンドスタジオ 13.0.1

ゼンドスタジオ 13.0.1

強力な PHP 統合開発環境

ドリームウィーバー CS6

ドリームウィーバー CS6

ビジュアル Web 開発ツール

SublimeText3 Mac版

SublimeText3 Mac版

神レベルのコード編集ソフト(SublimeText3)

オープンソース!ゾーイデプスを超えて! DepthFM: 高速かつ正確な単眼深度推定! オープンソース!ゾーイデプスを超えて! DepthFM: 高速かつ正確な単眼深度推定! Apr 03, 2024 pm 12:04 PM

0.この記事は何をするのですか?私たちは、多用途かつ高速な最先端の生成単眼深度推定モデルである DepthFM を提案します。従来の深度推定タスクに加えて、DepthFM は深度修復などの下流タスクでも最先端の機能を実証します。 DepthFM は効率的で、いくつかの推論ステップ内で深度マップを合成できます。この作品について一緒に読みましょう〜 1. 論文情報タイトル: DepthFM: FastMonocularDepthEstimationwithFlowMatching 著者: MingGui、JohannesS.Fischer、UlrichPrestel、PingchuanMa、Dmytr

Tongyi Qianwen が再びオープンソースになり、Qwen1.5 では 6 つのボリューム モデルが提供され、そのパフォーマンスは GPT3.5 を超えます Tongyi Qianwen が再びオープンソースになり、Qwen1.5 では 6 つのボリューム モデルが提供され、そのパフォーマンスは GPT3.5 を超えます Feb 07, 2024 pm 10:15 PM

春節に合わせて、Tongyi Qianwen Model (Qwen) のバージョン 1.5 がオンラインになりました。今朝、新しいバージョンのニュースが AI コミュニティの注目を集めました。大型モデルの新バージョンには、0.5B、1.8B、4B、7B、14B、72Bの6つのモデルサイズが含まれています。その中でも最強バージョンの性能はGPT3.5やMistral-Mediumを上回ります。このバージョンには Base モデルと Chat モデルが含まれており、多言語サポートを提供します。アリババの同義前文チームは、関連技術が同義前文公式ウェブサイトと同義前文アプリでもリリースされたと述べた。さらに、本日の Qwen 1.5 リリースには、32K のコンテキスト長のサポート、Base+Chat モデルのチェックポイントのオープン、および 32K のコンテキスト長のサポートなどのハイライトもあります。

エンコーダ/デコーダ アーキテクチャを放棄し、より効果的なエッジ検出に拡散モデルを使用する 国立防衛工科大学は DiffusionEdge を提案しました エンコーダ/デコーダ アーキテクチャを放棄し、より効果的なエッジ検出に拡散モデルを使用する 国立防衛工科大学は DiffusionEdge を提案しました Feb 07, 2024 pm 10:12 PM

現在のディープ エッジ検出ネットワークは通常、エンコーダ/デコーダ アーキテクチャを採用しています。このアーキテクチャには、マルチレベルの特徴をより適切に抽出するためのアップ サンプリング モジュールとダウン サンプリング モジュールが含まれています。ただし、この構造では、ネットワークが正確かつ詳細なエッジ検出結果を出力することが制限されます。この問題に対して、AAAI2024 に関する論文は新しい解決策を提供しています。論文のタイトル: DiffusionEdge:DiffusionProbabilisticModelforCrispEdgeDetection 著者: Ye Yunfan (国立国防技術大学)、Xu Kai (国立国防技術大学)、Huang Yuxing (国立国防技術大学)、Yi Renjiao (国立国防技術大学)、Cai Zhiping (防衛工科大学) 論文リンク:https://ar

YOLOは不滅です! YOLOv9 がリリースされました: パフォーマンスとスピード SOTA~ YOLOは不滅です! YOLOv9 がリリースされました: パフォーマンスとスピード SOTA~ Feb 26, 2024 am 11:31 AM

現在の深層学習手法は、モデルの予測結果が実際の状況に最も近くなるように、最適な目的関数を設計することに重点を置いています。同時に、予測に十分な情報を取得するには、適切なアーキテクチャを設計する必要があります。既存の方法は、入力データがレイヤーごとの特徴抽出と空間変換を受けると、大量の情報が失われるという事実を無視しています。この記事では、ディープネットワークを介してデータを送信する際の重要な問題、つまり情報のボトルネックと可逆機能について詳しく説明します。これに基づいて、深層ネットワークが複数の目的を達成するために必要なさまざまな変化に対処するために、プログラマブル勾配情報 (PGI) の概念が提案されています。 PGI は、目的関数を計算するためのターゲット タスクに完全な入力情報を提供することで、ネットワークの重みを更新するための信頼できる勾配情報を取得できます。さらに、新しい軽量ネットワーク フレームワークが設計されています。

こんにちは、電気アトラスです!ボストン・ダイナミクスのロボットが復活、180度の奇妙な動きにマスク氏も恐怖 こんにちは、電気アトラスです!ボストン・ダイナミクスのロボットが復活、180度の奇妙な動きにマスク氏も恐怖 Apr 18, 2024 pm 07:58 PM

Boston Dynamics Atlas は正式に電動ロボットの時代に突入します!昨日、油圧式アトラスが歴史の舞台から「涙ながらに」撤退したばかりですが、今日、ボストン・ダイナミクスは電動式アトラスが稼働することを発表しました。ボストン・ダイナミクス社は商用人型ロボットの分野でテスラ社と競争する決意を持っているようだ。新しいビデオが公開されてから、わずか 10 時間ですでに 100 万人以上が視聴しました。古い人が去り、新しい役割が現れるのは歴史的な必然です。今年が人型ロボットの爆発的な年であることは間違いありません。ネットユーザーは「ロボットの進歩により、今年の開会式は人間のように見え、人間よりもはるかに自由度が高い。しかし、これは本当にホラー映画ではないのか?」とコメントした。ビデオの冒頭では、アトラスは仰向けに見えるように地面に静かに横たわっています。次に続くのは驚くべきことです

超知性の生命力が覚醒する!しかし、自己更新 AI の登場により、母親はデータのボトルネックを心配する必要がなくなりました。 超知性の生命力が覚醒する!しかし、自己更新 AI の登場により、母親はデータのボトルネックを心配する必要がなくなりました。 Apr 29, 2024 pm 06:55 PM

世界は狂ったように大きなモデルを構築していますが、インターネット上のデータだけではまったく不十分です。このトレーニング モデルは「ハンガー ゲーム」のようであり、世界中の AI 研究者は、データを貪欲に食べる人たちにどのように餌を与えるかを心配しています。この問題は、マルチモーダル タスクで特に顕著です。何もできなかった当時、中国人民大学学部のスタートアップチームは、独自の新しいモデルを使用して、中国で初めて「モデル生成データフィード自体」を実現しました。さらに、これは理解側と生成側の 2 つの側面からのアプローチであり、両方の側で高品質のマルチモーダルな新しいデータを生成し、モデル自体にデータのフィードバックを提供できます。モデルとは何ですか? Awaker 1.0 は、中関村フォーラムに登場したばかりの大型マルチモーダル モデルです。チームは誰ですか?ソフォンエンジン。人民大学ヒルハウス人工知能大学院の博士課程学生、ガオ・イージャオ氏によって設立されました。

アメリカ空軍が初のAI戦闘機を公開し注目を集める!大臣はプロセス全体を通じて干渉することなく個人的にテストを実施し、10万行のコードが21回にわたってテストされました。 アメリカ空軍が初のAI戦闘機を公開し注目を集める!大臣はプロセス全体を通じて干渉することなく個人的にテストを実施し、10万行のコードが21回にわたってテストされました。 May 07, 2024 pm 05:00 PM

最近、軍事界は、米軍戦闘機が AI を使用して完全自動空戦を完了できるようになったというニュースに圧倒されました。そう、つい最近、米軍のAI戦闘機が初めて公開され、その謎が明らかになりました。この戦闘機の正式名称は可変安定性飛行シミュレーター試験機(VISTA)で、アメリカ空軍長官が自ら飛行させ、一対一の空戦をシミュレートした。 5 月 2 日、フランク ケンダル米国空軍長官は X-62AVISTA でエドワーズ空軍基地を離陸しました。1 時間の飛行中、すべての飛行動作が AI によって自律的に完了されたことに注目してください。ケンダル氏は「過去数十年にわたり、私たちは自律型空対空戦闘の無限の可能性について考えてきたが、それは常に手の届かないものだと思われてきた」と語った。しかし今では、

Kuaishou バージョンの Sora「Ke Ling」がテスト用に公開されています。120 秒以上のビデオを生成し、物理学をより深く理解し、複雑な動きを正確にモデル化できます。 Kuaishou バージョンの Sora「Ke Ling」がテスト用に公開されています。120 秒以上のビデオを生成し、物理学をより深く理解し、複雑な動きを正確にモデル化できます。 Jun 11, 2024 am 09:51 AM

何?ズートピアは国産AIによって実現するのか?ビデオとともに公開されたのは、「Keling」と呼ばれる新しい大規模な国産ビデオ生成モデルです。 Sora も同様の技術的ルートを使用し、自社開発の技術革新を多数組み合わせて、大きく合理的な動きをするだけでなく、物理世界の特性をシミュレートし、強力な概念的結合能力と想像力を備えたビデオを制作します。データによると、Keling は、最大 1080p の解像度で 30fps で最大 2 分の超長時間ビデオの生成をサポートし、複数のアスペクト比をサポートします。もう 1 つの重要な点は、Keling は研究所が公開したデモやビデオ結果のデモンストレーションではなく、ショートビデオ分野のリーダーである Kuaishou が立ち上げた製品レベルのアプリケーションであるということです。さらに、主な焦点は実用的であり、白紙小切手を書かず、リリースされたらすぐにオンラインに移行することです。Ke Ling の大型モデルは Kuaiying でリリースされました。

See all articles