強化学習で行列乗算アルゴリズムを発見、DeepMind が Nature の表紙を飾り、AlphaTensor を発売-AI-php.cn

アルゴリズム発見の自動化のプロセスと進捗状況

将来の研究と応用への影響

ホームページ

テクノロジー周辺機器

強化学習で行列乗算アルゴリズムを発見、DeepMind が Nature の表紙を飾り、AlphaTensor を発売

王林

Apr 18, 2023 am 09:46 AM

ai アルゴリズム

アルゴリズムは、何千年もの間、数学者が基本的な演算を実行するのに役立ってきました。昔、古代エジプト人は九九を使わずに 2 つの数値を乗算するアルゴリズムを発明しました。ギリシャの数学者ユークリッドは、今日でも使用されている最大公約数を計算するアルゴリズムを説明しました。イスラム黄金時代、ペルシアの数学者ムハンマド・イブン・ムーサ・アル・フワリズミは、その後の研究に大きな影響を与える一次方程式および二次方程式を解くための新しいアルゴリズムを考案しました。

実際、アルゴリズムという言葉の出現についての格言があります。ペルシャの数学者ムハンマド・イブン・ムーサ・アル・フワリズミの名前にあるアル・フワリズミという言葉は、ラテン語に訳すと次のようになります。 Algoritmi という意味は、アルゴリズムという言葉につながります。しかし、今日私たちはアルゴリズムをよく知っていますが、教室で学ぶことができ、科学研究の分野でも頻繁にアルゴリズムに遭遇します。社会全体がアルゴリズムを使用しているように見えますが、新しいアルゴリズムを発見するプロセスは非常に困難です。。

現在、DeepMind は AI を使用して新しいアルゴリズムを発見しています。

Nature の表紙論文の最新号「強化学習によるより高速な行列乗算アルゴリズムの発見」で、DeepMind は AlphaTensor を提案し、これが次のような基本的な関数に使用できる最初のアルゴリズムであると述べました。行列の乗算として、新しい、効率的で正しいと証明できるアルゴリズムを発見することを使命とする人工知能システム。簡単に言えば、AlphaTensor を使用すると、新しいアルゴリズムを発見できます。この研究は、2 つの行列を乗算する最速の方法を見つけるという、数学における 50 年来の未解決の問題に光を当てます。

強化学習で行列乗算アルゴリズムを発見、DeepMind が Nature の表紙を飾り、AlphaTensor を発売

紙のアドレス： https://www.nature.com/articles/s41586-022-05172-4
GitHub アドレス: https://github.com/deepmind / alphatensor

AlphaTensor は、チェスの AlphaZero に基づいて構築されており、エージェントに勝つことができます。囲碁や将棋などのボードゲームの人間。この作品は、AlphaZero がゲームでの使用から未解決の数学的問題を解決するために初めて使用されるまでの移行を示しています。

行列の乗算

行列の乗算は、代数学の最も単純な演算の 1 つであり、通常は高校の数学の授業で教えられます。しかし、教室の外では、この地味な数学的演算が現代のデジタル世界に多大な影響を与え、現代のコンピューティングのいたるところに浸透しています。

強化学習で行列乗算アルゴリズムを発見、DeepMind が Nature の表紙を飾り、AlphaTensor を発売

#2 つの 3x3 行列を乗算する例。

行列の乗算は、スマートフォンの画像処理や音声コマンドの認識など、私たちの生活のあらゆるところに隠されていることに気づいていないかもしれません。コンピューターゲームのグラフィックスの生成など、舞台裏での計算。世界中の企業は、行列の乗算を効率的に解くためのコンピューティングハードウェアの開発に膨大な時間と資金を費やすことに積極的です。したがって、行列の乗算効率の小さな改善でも、広範囲に影響を与える可能性があります。

数学者は何世紀にもわたって、標準の行列乗算アルゴリズムが最も効率的なアルゴリズムであると信じてきました。しかし 1969 年、ドイツの数学者フォルケンストラッセンは、より優れたアルゴリズムが存在することを証明し、数学界に衝撃を与えました。

強化学習で行列乗算アルゴリズムを発見、DeepMind が Nature の表紙を飾り、AlphaTensor を発売

標準アルゴリズムと Strassen アルゴリズムを比較すると、後者の方が実行する乗算演算が 1 つ少なく、7 です。前者では 8 回必要となり、全体の効率が大幅に向上します。

ストラッセンは、非常に小さな行列 (サイズ 2x2) を研究することで、行列の項を組み合わせてより大きな高速アルゴリズムを生成する賢い方法を発見しました。。その後数十年間、研究者たちはより大きな行列を研究してきましたが、3x3 行列を乗算する効率的な方法さえまだ解決されていません。

DeepMind による新しい研究では、最新の AI テクノロジーが新しい行列乗算アルゴリズムの自動検出をどのように推進しているかを調査しています。人間の直観の進歩に基づいて、AlphaTensor によって発見されたアルゴリズムは、より大きな行列に対して多くの SOTA メソッドよりも効率的です。この研究は、AI によって設計されたアルゴリズムが人間によって設計されたアルゴリズムよりも優れていることを示しており、アルゴリズム発見の分野において重要な前進となります。

アルゴリズム発見の自動化のプロセスと進捗状況

まず、行列乗算の効率的なアルゴリズムを発見するという問題をシングルプレイヤーゲームに変換します。このうち、board は、現在のアルゴリズムがどの程度正しいかを把握するために使用される 3 次元テンソル (数値の配列) です。アルゴリズムの命令に対応する一連の許可された動きを通じて、プレイヤーはテンソルを変更し、そのエントリをゼロに戻そうとします。

プレイヤーがこれを行うことができれば、任意の行列のペアに対して証明可能で正しい行列乗算アルゴリズムが生成され、その効率はテンソルをゼロにするために必要なステップ数によって測定されます。。

このゲームは非常に挑戦的で、考慮すべきアルゴリズムの数は、行列の乗算のような小さな場合であっても、宇宙の原子の数よりもはるかに多くなります。何十年にもわたって AI の課題であった囲碁と比較すると、このゲームには 1 手あたり 30 桁も多くの可能な手があります (DeepMind が検討した設定の 1 つは 10^33+ でした)

#従来のゲームとは大きく異なるこの領域の課題に対処するために、DeepMind は、問題固有の帰納的バイアスを組み込んだ新しいニューラルネットワークアーキテクチャ、有用な合成データを生成するプログラム、および問題の対称性を利用します。

次に、DeepMind は、既存の行列乗算アルゴリズムの知識がない状態から、ゲームをプレイできるように強化学習エージェント AlphaTensor をトレーニングしました。 AlphaTensor は学習によって時間の経過とともに徐々に改善され、歴史的に高速な行列アルゴリズム (ストラッセンのアルゴリズムなど) を再発見したり、以前に知られていたよりも高速なアルゴリズムを発見したりします。

強化学習で行列乗算アルゴリズムを発見、DeepMind が Nature の表紙を飾り、AlphaTensor を発売

AlphaTensor 正しい行列乗算アルゴリズムを見つけることが目的のシングルプレイヤーゲームです。ゲームの状態は、実行すべき残りの作業を表す数値の立方体配列 (灰色は 0、青色は 1、緑色は - 1 を表します) です。

たとえば、学校で教えられる従来のアルゴリズムが、人間の知恵を通じて 4x5 と 5x5 の行列の乗算を 100 回の乗算で完了できるとします。その数を 80 分の 1 に減らすことができます。比較すると、AlphaTensor によって発見されたアルゴリズムは、次の図に示すように、わずか 76 回の乗算を使用して同じ演算を実行します。

強化学習で行列乗算アルゴリズムを発見、DeepMind が Nature の表紙を飾り、AlphaTensor を発売

上記の例に加えて、AlphaTensor によって発見されたアルゴリズムは、有限体における Strassen の 2 次アルゴリズムも改良しています。初めてのアルゴリズム。小さな行列を乗算するためのこれらのアルゴリズムは、任意のサイズのより大きな行列を乗算するためのプリミティブとして使用できます。

AlphaTensor は、各サイズの行列乗算アルゴリズムが数千個ある、SOTA の複雑さを備えた多様なアルゴリズムのセットも発見し、行列乗算アルゴリズムの空間がこれまで考えられていたよりも大きいことを示しています。

この豊かな空間のアルゴリズムには、さまざまな数学的および実用的な特性があります。この多様性を利用して、DeepMind は、特定のハードウェア (Nvidia V100 GPU、Google TPU v2 など) で高速に実行されるアルゴリズムを特に検出するように AlphaTensor を調整しました。これらのアルゴリズムは、同じハードウェア上で一般的に使用されるアルゴリズムよりも 10 ～ 20% 高速に大規模な行列乗算を実行し、任意の目的を最適化する際の AlphaTensor の柔軟性を示しています。

#AlphaTensor には、アルゴリズムランタイムに対応するターゲットがあります。正しい行列乗算アルゴリズムが見つかると、指定されたハードウェアでベンチマークが実行され、指定されたハードウェアでより効率的なアルゴリズムを学習するために AlphaTensor にフィードバックされます。

将来の研究と応用への影響

数学的観点から見ると、DeepMind の結果は、計算問題を解決するための最速のアルゴリズムを特定することを目的とした複雑性理論の指針となる可能性があります。 AlphaTensor は、可能なアルゴリズムの空間を以前の方法よりも効率的に探索することで、行列乗算アルゴリズムの豊富さについての理解を深めるのに役立ちます。

さらに、行列乗算はコンピューターグラフィックス、デジタル通信、ニューラルネットワークトレーニング、科学計算などの多くのコンピューティングタスクの中核コンポーネントであるため、AlphaTensor によって発見されたアルゴリズムはこれらのタスクを大幅に改善できます。フィールド、計算効率。

この記事では行列の乗算という特定の問題のみに焦点を当てていますが、DeepMind は、より多くの人々に AI を使用して他の基本的なコンピューティングタスクのアルゴリズム発見をガイドするよう促したいと考えています。さらに、DeepMind の研究は、AlphaZero の強力なアルゴリズムが従来のゲームの領域をはるかに超えており、数学分野の未解決の問題の解決に役立つことも示しています。

DeepMind は、研究に基づいて、将来的には人工知能をさらに活用して、社会が数学と科学における最も重要な課題のいくつかを解決できるようにしたいと考えています。

以上が強化学習で行列乗算アルゴリズムを発見、DeepMind が Nature の表紙を飾り、AlphaTensor を発売の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

このウェブサイトの声明

この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

ホットAIツール

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

脱衣画像を無料で

Clothoff.io

AI衣類リムーバー

AI Hentai Generator

AIヘンタイを無料で生成します。

ホットツール

メモ帳++7.3.1

使いやすく無料のコードエディター

SublimeText3 中国語版

中国語版、とても使いやすい

ゼンドスタジオ 13.0.1

強力な PHP 統合開発環境

ドリームウィーバー CS6

ビジュアル Web 開発ツール

SublimeText3 Mac版

神レベルのコード編集ソフト（SublimeText3）

ホットトピック

Gmailメールのログイン入り口はどこですか？

7526

CakePHP チュートリアル

1378

Steamのアカウント名の形式は何ですか

Win11 Activation Key Permanent

NYTの接続はヒントと回答です

Related knowledge

Debian Apacheログレベルを設定する方法 Apr 13, 2025 am 08:33 AM

この記事では、DebianシステムのApachewebサーバーのロギングレベルを調整する方法について説明します。構成ファイルを変更することにより、Apacheによって記録されたログ情報の冗長レベルを制御できます。方法1：メイン構成ファイルを変更して、構成ファイルを見つけます。Apache2.xの構成ファイルは、通常/etc/apache2/ディレクトリにあります。ファイル名は、インストール方法に応じて、apache2.confまたはhttpd.confである場合があります。構成ファイルの編集：テキストエディターを使用してルートアクセス許可を使用して構成ファイルを開く（nanoなど）：sudonano/etc/apache2/apache2.conf

Debian Readdirのパフォーマンスを最適化する方法 Apr 13, 2025 am 08:48 AM

Debian Systemsでは、Directoryコンテンツを読み取るためにReadDirシステム呼び出しが使用されます。パフォーマンスが良くない場合は、次の最適化戦略を試してください。ディレクトリファイルの数を簡素化します。大きなディレクトリをできる限り複数の小さなディレクトリに分割し、Readdirコールごとに処理されたアイテムの数を減らします。ディレクトリコンテンツのキャッシュを有効にする：キャッシュメカニズムを構築し、定期的にキャッシュを更新するか、ディレクトリコンテンツが変更されたときに、頻繁な呼び出しをreaddirに削減します。メモリキャッシュ（memcachedやredisなど）またはローカルキャッシュ（ファイルやデータベースなど）を考慮することができます。効率的なデータ構造を採用する：ディレクトリトラバーサルを自分で実装する場合、より効率的なデータ構造（線形検索の代わりにハッシュテーブルなど）を選択してディレクトリ情報を保存およびアクセスする

Debian Readdirによるファイルソートを実装する方法 Apr 13, 2025 am 09:06 AM

Debian Systemsでは、Readdir関数はディレクトリコンテンツを読み取るために使用されますが、それが戻る順序は事前に定義されていません。ディレクトリ内のファイルを並べ替えるには、最初にすべてのファイルを読み取り、QSORT関数を使用してソートする必要があります。次のコードは、debianシステムにreaddirとqsortを使用してディレクトリファイルを並べ替える方法を示しています。

Debian Mail Serverファイアウォールの構成のヒント Apr 13, 2025 am 11:42 AM

Debian Mail Serverのファイアウォールの構成は、サーバーのセキュリティを確保するための重要なステップです。以下は、iPtablesやFirewalldの使用を含む、一般的に使用されるファイアウォール構成方法です。 iPtablesを使用してファイアウォールを構成してIPTablesをインストールします（まだインストールされていない場合）：sudoapt-getupdatesudoapt-getinstalliptablesview現在のiptablesルール：sudoiptables-l configuration

Debian Mail Server SSL証明書のインストール方法 Apr 13, 2025 am 11:39 AM

Debian Mail ServerにSSL証明書をインストールする手順は次のとおりです。1。最初にOpenSSL Toolkitをインストールすると、OpenSSLツールキットがシステムに既にインストールされていることを確認してください。インストールされていない場合は、次のコマンドを使用してインストールできます。sudoapt-getUpdatesudoapt-getInstalopenssl2。秘密キーと証明書のリクエストを生成次に、OpenSSLを使用して2048ビットRSA秘密キーと証明書リクエスト（CSR）を生成します：Openss

Debian Readdirが他のツールと統合する方法 Apr 13, 2025 am 09:42 AM

DebianシステムのReadDir関数は、ディレクトリコンテンツの読み取りに使用されるシステムコールであり、Cプログラミングでよく使用されます。この記事では、ReadDirを他のツールと統合して機能を強化する方法について説明します。方法1：C言語プログラムを最初にパイプラインと組み合わせて、cプログラムを作成してreaddir関数を呼び出して結果をinclude＃include＃include inctargc、char*argv []）{dir*dir; structdireant*entry; if（argc！= 2）{（argc！= 2）{

Debian OpenSSLがどのように中間の攻撃を防ぐか Apr 13, 2025 am 10:30 AM

Debian Systemsでは、OpenSSLは暗号化、復号化、証明書管理のための重要なライブラリです。中間の攻撃（MITM）を防ぐために、以下の測定値をとることができます。HTTPSを使用する：すべてのネットワーク要求がHTTPの代わりにHTTPSプロトコルを使用していることを確認してください。 HTTPSは、TLS（Transport Layer Security Protocol）を使用して通信データを暗号化し、送信中にデータが盗まれたり改ざんされたりしないようにします。サーバー証明書の確認：クライアントのサーバー証明書を手動で確認して、信頼できることを確認します。サーバーは、urlsessionのデリゲート方法を介して手動で検証できます

Debian Hadoopログ管理を行う方法 Apr 13, 2025 am 10:45 AM

DebianでHadoopログを管理すると、次の手順とベストプラクティスに従うことができます。ログ集約を有効にするログ集約を有効にします。Yarn.log-Aggregation-set yarn-site.xmlファイルでは、ログ集約を有効にします。ログ保持ポリシーの構成：yarn.log-aggregation.retain-secondsを設定して、172800秒（2日）などのログの保持時間を定義します。ログストレージパスを指定：Yarn.Nを介して

See all articles

強化学習で行列乗算アルゴリズムを発見、DeepMind が Nature の表紙を飾り、AlphaTensor を発売

アルゴリズム発見の自動化のプロセスと進捗状況

将来の研究と応用への影響

ホットAIツール

Undresser.AI Undress

AI Clothes Remover

Undress AI Tool

Clothoff.io

AI Hentai Generator

人気の記事

ホットツール

メモ帳++7.3.1

SublimeText3 中国語版

ゼンドスタジオ 13.0.1

ドリームウィーバー CS6

SublimeText3 Mac版

ホットトピック