薬物相互作用予測タスクにおけるマルチモーダル DNN モデルの適用

WBOY
リリース: 2023-05-31 11:01:31
転載
1057 人が閲覧しました

多模态 DNN 模型在药物相互作用预测任务中的应用

1. 背景の紹介

まず、創薬に関連する背景について説明します。

#1. 背景の紹介

多模态 DNN 模型在药物相互作用预测任务中的应用

##薬物創薬分野は近年非常に注目を集めており、特に医薬品の研究開発を含む製薬会社の創薬業務を支援するための AI の使用が注目されています。医薬品の研究開発プロセスは非常に長いサイクルであり、通常、ある種の臨床疾患に対する最初の医薬品の研究開発プロセスには数十億の資金と10年以上の時間がかかります。主に以下の段階に分かれます。

# (1) 疾患標的の研究と疾患コアタンパク質の確認。

# (2) 臨床試験の前に、薬物の毒性、有効性、服用方法などの研究を含め、薬物の有効性を検証します。

(3) 臨床試験。

# (4) FDA の承認と認証。

#つまり、従来の医薬品の研究開発プロセスのサイクルは非常に長いものです。さらに、10,000 を超える薬剤の初期承認のうち、5 つの薬剤が臨床試験段階に入り、最終的に 1 つの薬剤のみが販売を承認されました。このような背景から、製薬企業が候補薬の中から有効な薬をより迅速に選択できるように支援し、臨床試験段階で薬の影響や役割、有効性などを迅速に事前調査する方法が注目の研究テーマとなっています。 AI、特にディープ ニューラル ネットワーク技術により、医薬品開発プロセスが大幅に加速されます。

多模态 DNN 模型在药物相互作用预测任务中的应用

本日共有される内容は薬剤スクリーニングに関するものではなく、主に候補薬剤の副作用と有効性に焦点を当てています。主な研究目的は、薬物の毒性を軽減し、薬物の有効性を向上させることです。

上図に示すように、DDI (Drug-Drug Interaction) は薬物間の相互作用を指します。研究薬と既存薬とのクロス分析を行い、研究薬の身体への影響などの副作用を実験により事前に発見・分類します。わかりやすい例で言えば、「薬は毒によって3つに分かれる」という場合、薬の毒性は主にどこに反映されるのでしょうか?多くの場合、これはある薬物が他の薬物と組み合わされること、つまり 2 つ以上の薬物間の化学的相互作用によって発生します。右下の写真は 3 種類の薬剤を示していますが、イトラコナゾールは腫瘍関連薬であり、アベマシクリブと混合すると、肝不全、肝不全、腎不全などの重篤な副作用を引き起こします。患者は深刻な結果を招く可能性があります。アベシクリブとダブラフェニブを併用すると血清濃度が低下し、他の疾患を引き起こす可能性があります。そのため、新薬の開発過程では膨大な数の試験が必要ですが、生身の人間を使って試験することは不可能で、マウスなどの動物でしか試験できません。

本日共有される内容は、マルチモーダル ニューラル ネットワークを使用して、既存の (開発中および既知を含む) 薬剤成分、アレルギーなどに基づいて薬剤 DDI を事前に予測するというものです。

2. 提起された質問

多模态 DNN 模型在药物相互作用预测任务中的应用

上の図に示すように、薬物相互作用は、薬物 d1 (アベキシクリブ) と薬物 d2 (ダブラフェニブ) などの薬物相互作用の結果を記述する DDI マトリックスとして要約できます。血清濃度の低下)。この研究には、572 の薬剤 (d) と 65 の反応結果 (y、血清濃度の低下など) を含む 37,264 件の DDI データが含まれていました。そして、このデータに基づいて、ドラッグ ナレッジ グラフ (DKG) が構築されました。ノードは薬物であり、エッジは薬物間の関係です。 DKG トリプルは、{D: 薬物、R: 薬物間関係、T: 尾部エンティティ} です。

#上記のデータに加えて、マルチモーダル モデルには薬剤の異種特徴 (HF、異種特徴) も組み込まれています: {ターゲット: ターゲット、部分構造:組成・化学構造、酵素:enzyme}、対象となる情報がタンパク質であるなど、それぞれの特徴の次元が異なります。最後に、DDI マトリックス、DKG、および HF がモデリングのために同じ確率分布に融合されます。

2. MDNN モデルの紹介

次に、ヘテロジニアス マルチモーダル MDNN のフレームワークを紹介します。モデル。

#1. MDNN 全体のフレームワーク

多模态 DNN 模型在药物相互作用预测任务中的应用

# これはモデルは MDNN と呼ばれます. 基本データは主に DDI マトリックスとヘテロジニアス データの 2 つの部分に分かれています. モデル フレームワークは主に次の 3 つの部分で構成されます:

# #(1) DKG 部分に基づく: 主に医薬品そのものの成分(有効成分、毒性成分)、医薬品間の関係などの情報を医薬品ナレッジグラフを構築して表現します。

(2) HF 部分に基づく: 標的、酵素、分子などの異種の特性データを統合して薬物自体を記述します。構造、基本的な機能情報。

(3) マルチモーダル融合ニューラル ネットワーク: DKG と HF の 2 つの特徴データを効果的に融合し、統合を実行します。モデリング。

2. DKG モジュール構築

DKG に基づいた構築プロセスを紹介します。

多模态 DNN 模型在药物相互作用预测任务中的应用

#上の図は、医薬品ナレッジ グラフの主な内容を示しています。左の図はDDI マトリックス: マトリックスには約 600 の薬物が含まれており、これらの薬物の組成と作用情報はデータベース (DrugBank、つまり「薬物バンク」) に保管されています。右の図は、酵素、キャリア、ターゲットなどの異質な基本的特徴など、「ドラッグバンク」内の医薬品情報の例を示しています。その中で、比較的重要な4つの特徴が挙げられます。医薬品DB05812を例にとると、ターゲットに加えて、酵素と分子構造に加えて、キャリアとトランスポーターもあります。ただし、これら 2 種類のデータは比較的まばらであり、他の特徴ほど多くの次元を持っていません。現在のデータセットにおける区別はありません。したがって、これら 2 つのデータは当面は使用されません。使用される主なデータは、 ターゲット、酵素、分子構造です。

#

上の図に示すように、ナレッジ グラフは主にノードとエッジで構成されます。ノードは医薬品と成分、エッジは関係です。この例においてトリプレットによって表示される関係は、毒性成分関係、すなわち、ノード薬物「DB05812」とノード成分「P02768」との間に毒性成分関係がある。 「ドラッグバンク」から取得した薬物成分関係トリプルを基に、572種類の薬物を含むDKGナレッジグラフが形成され、トリプルの辺(関係)を意味関係と呼び、関係タイプは合計157種類あります。構成要素 尾部エンティティ ノードは 1043 種類あります。各 DKG は、タスクの要件に応じて「ドラッグ バンク」から対応する情報を抽出して構築できるため、DKG は「ドラッグ バンク」ナレッジ グラフのサブグラフに相当します。

多模态 DNN 模型在药物相互作用预测任务中的应用

DKG に基づいて、2 種類の情報が要約されます。上図はセマンティクスを示しています。構築の関係情報モデル。有毒成分に基づいて、まず薬物 (d) と前の層の関係 (r) の内積を計算し、それを現在の層の重み (W1) で合計して π 関数、つまり薬物のエッジ情報とノード情報は、π 関数 によって合計され、次に、π 関数と前の層コンポーネント (t) の重み付き合計を実行して e を取得します。つまり、エッジ情報が取得されます。

多模态 DNN 模型在药物相互作用预测任务中的应用

#同様に、グラフの位相構造情報モデルの構成を上図に示します。 。毒性成分に加えて、薬物には他の複数の成分関係も含まれる場合があり、同じ薬物の複数の関係 (エッジ、つまり e) とそれらに対応する重み W2 を接続して、最終的に各薬物に対応する E を取得できます。上記の方法により、DKG エッジと位相構造情報が効果的に融合されて表現されます。

3. HF モジュールの構造

上記のサイド情報と DDI 情報に加えて、以下に示すように、 , 薬物には非常に豊富なマルチモーダル情報も含まれています: 同じ薬物が複数の標的に作用することができます。さまざまな薬物も異なる分子構造を持ち、対応する分子特性を表しています。薬物はさまざまな酵素の作用下で反応します。異なる標的と組み合わせると、 。これら 3 種類の情報がベクトル化され、単純な Jaccard 類似度によって薬物間の類似性が測定され、対応する類似度行列が取得されます。

多模态 DNN 模型在药物相互作用预测任务中的应用

多模态 DNN 模型在药物相互作用预测任务中的应用

#ファイナルフュージョン 三人類似性行列により各薬物に対応する E'、つまり薬物の異性体特性に基づく情報が得られます。この特徴ベクトルの次元も小さく、1162 のターゲット、583 の構造、および 202 の酵素に関する情報が含まれています。 #4. マルチモデル融合レイヤー

多模态 DNN 模型在药物相互作用预测任务中的应用

##上図に示すように、各薬物の DKG 結果 E と HF 結果 E' が最終的にスプライスされ、融合層を介して融合されて次の結果が得られます。

次に、softmax 関数を使用して出力層を取得します。

多模态 DNN 模型在药物相互作用预测任务中的应用

モデル全体のフレームワークは上図のようになり、複雑なフレームワーク構造ではありませんが、比較的効果的に薬剤情報を組み合わせています。

3. MDNN モデルの効果

次に、モデルの効果を共有します。

多模态 DNN 模型在药物相互作用预测任务中的应用

#上の図は、現在より一般的に使用されているアルゴリズムである MDNN との比較結果を示しています。アルゴリズム Acc、AUC、F1、AUPR、精度、リコール、その他の評価指標において最先端の結果を達成しています。 (上記のアルゴリズムは GNN アルゴリズムには組み込まれていません。)

多模态 DNN 模型在药物相互作用预测任务中的应用

##上の図は、 DKGのMDNN融合、HKと非融合の効果の違い。どちらかの方法を単独で使用するよりも、融合の結果が優れていることが簡単にわかります。

多模态 DNN 模型在药物相互作用预测任务中的应用

# マルチモーダルパラメータ調整、つまりパラメータ感度の分析については、次のようになります。ニューラルネットワーク層数 l、ノード数 Ns の場合の各種評価指標をそれぞれ上図に示します。 およびその他のパラメータが変化し、それに応じて変動します。

多模态 DNN 模型在药物相互作用预测任务中的应用

#さらに、マルチタスク分析も実施しました。トレーニング セット内の薬物とテスト セット内の薬物間の DDI を予測するには、タスク B の予測モデルもトレーニング セットを通じて構築されますが、テスト セット内の薬物間の DDI を予測します。トレーニング セットとテスト セットの薬物が厳密に分離されている場合、モデルの予測効果は大幅に減少します。

#医薬品研究開発の分野では、DDI の研究だけでなく、いかに効果的に医薬品を発見/スクリーニングするかなど、解決すべき課題がまだ多くあります。 。

4. まとめ

最後に、今回共有した内容をまとめると、MDNN アルゴリズム自体は複雑ではありません。重要な作業は、マルチモーダル データと構造情報の使用です:

多模态 DNN 模型在药物相互作用预测任务中的应用

(1) に基づいて医薬品を構築する薬物効果ナレッジ グラフは、薬物自体の特性 (標的、分子構造、酵素) に基づいてマルチモーダルなデータ特徴を構築し、最終的にこれら 2 つの特徴を統合して MDNN モデルを構築します。

(2) DDI の予測問題を改善;

(3) 既存手法との比較、MDNN は機能するデータセット上で最適です。

#しかし、実際のアプリケーションでは、MDNN モデルには、方法論やデータの改善など、さらなる最適化と改善が必要な領域がまだ多くあります。 #5. Q&A セッション

#Q1: 「ドラッグ バンク」データ セットは公開データ セットですか?

A1: この研究のナレッジ グラフ データ セットは公開されており、元のデータ セット「Drug Bank」も公開データ セットです。しかし、各研究分野の医薬品によっては構築されるナレッジグラフデータセットも異なり、統一された普遍的なナレッジグラフは存在しません。

Q2: ナレッジグラフやマルチモーダルフュージョンなどの共有研究手法は、製薬分野以外ではどのような応用が可能ですか?プロテインとか免疫力とか?

A2: バイオ医薬品に加えて、電子商取引分野には多くのアプリケーションがあります。たとえば、User-Item クラスのデータ セットでは、User は職業、年齢、買い物タグなどの多くのマルチモーダル情報を持ちます。Item 製品にも多くの情報があり、それらの間には多くの関係があります。ショッピング、評価、お気に入り、クリックなどの行動。ドメイン データが異質な形式に準拠している場合は、これらの方法を分析に使用することができますが、難しいのは、特定のドメインでナレッジ グラフを構築することです。

以上が薬物相互作用予測タスクにおけるマルチモーダル DNN モデルの適用の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

関連ラベル:
ソース:51cto.com
このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。
人気のチュートリアル
詳細>
最新のダウンロード
詳細>
ウェブエフェクト
公式サイト
サイト素材
フロントエンドテンプレート