AIは学習しない!新しい研究により、人工知能のブラックボックスを解読する方法が明らかになりました
人工知能 (AI) は急速に発展していますが、人間にとって強力なモデルは「ブラック ボックス」です。
モデルの内部動作と、モデルが結論に達するプロセスを理解していません。
しかし、最近、ボン大学の化学情報学の専門家であるユルゲン・バジョラス教授と彼のチームは大きな進歩を遂げました。
彼らは、医薬品研究で使用される一部の人工知能システムがどのように動作するかを明らかにする技術を設計しました。
研究によると、人工知能モデルは、特定の化学相互作用を学習するのではなく、主に既存のデータを呼び出すことによって薬の有効性を予測します。
——言い換えれば、AI の予測は純粋に記憶のつなぎ合わせに基づいており、機械学習は実際には学習しません。
彼らの研究結果は、最近 Nature Machine Intelligence 誌に掲載されました。
#論文アドレス: https://www.nature.com/articles/s42256-023-00756-9
医学の分野では、研究者たちは病気と戦うための効果的な活性物質を熱心に探しています。どの薬物分子が最も効果的でしょうか?
通常、これらの効果的な分子 (化合物) はタンパク質にドッキングされ、特定の生理学的作用連鎖を引き起こす酵素または受容体として機能します。
特殊な場合には、特定の分子が過剰な炎症反応などの体内の有害反応をブロックする役割もあります。
考えられる化合物の数は膨大で、効果的な化合物を見つけるのは干し草の山から針を探すようなものです。
そこで研究者らは、まず AI モデルを使用して、どの分子がそれぞれの標的タンパク質に最適にドッキングして強く結合するかを予測しました。これらの薬剤候補は、実験研究でさらに詳細にスクリーニングされます。
たとえば、グラフ ニューラル ネットワーク (GNN) は、特定の分子と標的タンパク質の結合の強さを予測するのに適しています。
#グラフは、オブジェクトを表すノードとノード間の関係を表すエッジで構成されます。タンパク質-リガンド複合体のグラフ表示では、グラフの端がタンパク質またはリガンドのノードを接続し、物質の構造、またはタンパク質とリガンド間の相互作用を表します。
GNN モデルは、X 線構造から抽出されたタンパク質-リガンド相互作用マップを使用して、リガンド親和性を予測します。
ユルゲン・バジョラス教授は、GNN モデルは私たちにとってブラックボックスのようなもので、それがどのように予測を導き出すのかを知る方法はないと述べました。
ユルゲン・バジョラス教授は、ボン大学 LIMES 研究所およびボン・アーヘン国際情報技術センター (ボン・アーヘン国際センター) に勤務しています。情報技術)とラマー機械学習および人工知能研究所。
人工知能はどのように機能するのでしょうか?
ボン大学の化学情報学部の研究者は、ローマのサピエンツァ大学の同僚とともに、グラフ ニューラル ネットワークが本当にタンパク質間の相互作用を学習するかどうかを詳細に分析しました。およびリガンドの効果。
研究者らは、特別に開発した「EdgeSHAPer」手法を使用して、合計 6 つの異なる GNN アーキテクチャを分析しました。
EdgeSHAPer プログラムは、GNN が化合物とタンパク質の間の最も重要な相互作用を学習したか、または他の手段で予測を行ったかを判断できます。
科学者らは、化合物の作用機序と標的タンパク質への結合の強さがわかっているタンパク質-リガンド複合体の構造から抽出されたグラフを使用して、6 つの GNN を訓練しました。
次に、トレーニングされた GNN を他の化合物でテストし、EdgeSHAPer を使用して GNN がどのように予測を生成するかを分析します。
「GNN が期待どおりに動作する場合、化合物と標的タンパク質の間の相互作用を学習し、特定の相互作用に優先順位を付けて予測を行う必要があります。」
しかし、研究チームの分析によると、6 つの GNN は基本的にこれを行うことができませんでした。ほとんどの GNN は、主にリガンドに焦点を当てて、一部のタンパク質と薬物の相互作用のみを学習します。
上の図は 6 つの GNN での実験結果を示しています。色分けされたバーは、EdgeSHAPer で決定された各予測の上位 25 のエッジを表しています。におけるタンパク質、リガンド、および相互作用の平均割合。
緑で表される相互作用がモデルが学習する必要があるものであることがわかりますが、実験全体における割合は高くなく、オレンジ色はリガンドを表しています。最も大きな割合を占めています。
分子の標的タンパク質への結合強度を予測するために、モデルは主に、標的タンパク質に関係なく、トレーニング中に遭遇した化学的に類似した分子とその結合データを「記憶」します。これらの記憶された化学的類似性が本質的に予測を決定します。
これは「賢いハンス効果」を彷彿とさせます。数えられるように見える馬と同じように、馬は実際に期待される結果を推測します。仲間の表情やしぐさの微妙な違いに基づいて。
これは、GNN のいわゆる「学習能力」が維持できない可能性があり、化学知識を使用できるため、モデルの予測が大幅に過大評価されていることを意味する可能性があります。より簡単な方法。
ただし、この研究では別の現象も見つかりました。試験化合物の効力が増加するにつれて、モデルはより多くの相互作用を学習する傾向があります。
おそらく、表現とトレーニング手法を変更することで、これらの GNN を望ましい方向にさらに改善することができます。ただし、分子グラフから物理量を学習できるという仮定は、一般に注意して扱う必要があります。
「人工知能は黒魔術ではありません。」
以上がAIは学習しない!新しい研究により、人工知能のブラックボックスを解読する方法が明らかになりましたの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

ホットAIツール

Undresser.AI Undress
リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover
写真から衣服を削除するオンライン AI ツール。

Undress AI Tool
脱衣画像を無料で

Clothoff.io
AI衣類リムーバー

AI Hentai Generator
AIヘンタイを無料で生成します。

人気の記事

ホットツール

メモ帳++7.3.1
使いやすく無料のコードエディター

SublimeText3 中国語版
中国語版、とても使いやすい

ゼンドスタジオ 13.0.1
強力な PHP 統合開発環境

ドリームウィーバー CS6
ビジュアル Web 開発ツール

SublimeText3 Mac版
神レベルのコード編集ソフト(SublimeText3)

ホットトピック









この記事では、Debian SystemsでApacheのログ形式をカスタマイズする方法について説明します。次の手順では、構成プロセスをガイドします。ステップ1:Apache構成ファイルにアクセスするDebianシステムのメインApache構成ファイルは、/etc/apache2/apache2.confまたは/etc/apache2/httpd.confにあります。次のコマンドを使用してルートアクセス許可を使用して構成ファイルを開きます。sudonano/etc/apache2/apache2.confまたはsudonano/etc/apache2/httpd.confステップ2:検索または検索または

Tomcatログは、メモリリークの問題を診断するための鍵です。 Tomcatログを分析することにより、メモリの使用状況とガベージコレクション(GC)の動作に関する洞察を得ることができ、メモリリークを効果的に見つけて解決できます。 Tomcatログを使用してメモリリークをトラブルシューティングする方法は次のとおりです。1。GCログ分析最初に、詳細なGCロギングを有効にします。 Tomcatの起動パラメーターに次のJVMオプションを追加します:-xx:printgcdetails-xx:printgcdateStamps-xloggc:gc.logこれらのパラメーターは、GCタイプ、リサイクルオブジェクトサイズ、時間などの情報を含む詳細なGCログ(GC.log)を生成します。分析GC.LOG

Debian Systemsでは、Readdir関数はディレクトリコンテンツを読み取るために使用されますが、それが戻る順序は事前に定義されていません。ディレクトリ内のファイルを並べ替えるには、最初にすべてのファイルを読み取り、QSORT関数を使用してソートする必要があります。次のコードは、debianシステムにreaddirとqsortを使用してディレクトリファイルを並べ替える方法を示しています。

Debian Systemsでは、Directoryコンテンツを読み取るためにReadDirシステム呼び出しが使用されます。パフォーマンスが良くない場合は、次の最適化戦略を試してください。ディレクトリファイルの数を簡素化します。大きなディレクトリをできる限り複数の小さなディレクトリに分割し、Readdirコールごとに処理されたアイテムの数を減らします。ディレクトリコンテンツのキャッシュを有効にする:キャッシュメカニズムを構築し、定期的にキャッシュを更新するか、ディレクトリコンテンツが変更されたときに、頻繁な呼び出しをreaddirに削減します。メモリキャッシュ(memcachedやredisなど)またはローカルキャッシュ(ファイルやデータベースなど)を考慮することができます。効率的なデータ構造を採用する:ディレクトリトラバーサルを自分で実装する場合、より効率的なデータ構造(線形検索の代わりにハッシュテーブルなど)を選択してディレクトリ情報を保存およびアクセスする

このガイドでは、Debian SystemsでSyslogの使用方法を学ぶように導きます。 Syslogは、ロギングシステムとアプリケーションログメッセージのLinuxシステムの重要なサービスです。管理者がシステムアクティビティを監視および分析して、問題を迅速に特定および解決するのに役立ちます。 1. syslogの基本的な知識Syslogのコア関数には以下が含まれます。複数のログ出力形式とターゲットの場所(ファイルやネットワークなど)をサポートします。リアルタイムのログ表示およびフィルタリング機能を提供します。 2。syslog(rsyslogを使用)をインストールして構成するDebianシステムは、デフォルトでrsyslogを使用します。次のコマンドでインストールできます:sudoaptupdatesud

この記事では、Debian SystemsでiPtablesまたはUFWを使用してファイアウォールルールを構成し、Syslogを使用してファイアウォールアクティビティを記録する方法について説明します。方法1:Iptablesiptablesの使用は、Debian Systemの強力なコマンドラインファイアウォールツールです。既存のルールを表示する:次のコマンドを使用して現在のiPtablesルールを表示します。Sudoiptables-L-N-vでは特定のIPアクセスを許可します。たとえば、IPアドレス192.168.1.100がポート80にアクセスできるようにします:sudoiptables-input-ptcp - dport80-s192.166

Debian Mail ServerにSSL証明書をインストールする手順は次のとおりです。1。最初にOpenSSL Toolkitをインストールすると、OpenSSLツールキットがシステムに既にインストールされていることを確認してください。インストールされていない場合は、次のコマンドを使用してインストールできます。sudoapt-getUpdatesudoapt-getInstalopenssl2。秘密キーと証明書のリクエストを生成次に、OpenSSLを使用して2048ビットRSA秘密キーと証明書リクエスト(CSR)を生成します:Openss

Debianシステムでは、nginxのアクセスログとエラーログのデフォルトのストレージ場所は次のとおりです。アクセスログ(アクセスログ):/var/log/nginx/access.logエラーログ(errorlog):/var/log/nginx/error.log上記のパスは、標準のdebiannginxインストールのデフォルト構成です。インストールプロセス中にログファイルストレージの場所を変更した場合は、nginx構成ファイル(通常は/etc/nginx/nginx.confまたは/etc/etc/nginx/sites-abailable/directoryにあります)を確認してください。構成ファイル
