デュアルタスクに基づくエンドツーエンドのテンプレート不要の応答予測モデル
再フォーマット| 修士課程の学生、Hu Haozhe です
論文リンク: https://doi.org/10.1007 /s10489-023-05048-8
3 つの主要な反応予測データセットでテストし、逆合成および順反応予測タスクでテストし、上記のモジュールで包括的なアブレーション実験を行ったところ、BiG2S が適切なパラメーター スケールの単一モデルで逆合成と順反応の両方を処理できることが実証されました。 . 応答予測タスク。事前トレーニングとデータ強化に基づく既存のテンプレートフリーの手法と比較して、BiG2S の全体的な予測能力は同様に優れています。
研究の背景逆合成と順合成は、有機化学、コンピュータ支援合成計画 (CASP)、コンピュータ支援創薬 (CADD) の分野における根本的な課題です。内容を書き換える場合、原文を維持したまま中国語に書き直す必要があります。
初期の逆合成計画システムは、分野の専門家によって事前にコード化された反応ルール、または物理化学に基づく計算に直接依存していましたが、深層学習の急速な発展に伴いました。現在この分野で主流となっている手法は、タスク固有のニューラル ネットワーク フレームワークを構築して、データ駆動型の観点から反応予測タスクを完了するというものです。その中でも、特定の事前の化学知識に依存しないテンプレートフリー手法は、エンドツーエンドの機械翻訳に似たシンプルさと柔軟性により、徐々にこの分野の主流の開発方向の1つになりました。
現在、ほとんどのテンプレートフリー逆合成モデルの入力と出力は SMILES 分子列であり、シーケンスツーシーケンス (Seq2Seq) プロセスを使用しています。この方法は、自然言語処理の分野における既存のモデル フレームワークと、SMILES 表現方法の成熟したデータ処理フローをうまく利用できます。
ただし、SMILES は 1 次元の文字列シーケンスであるため、分子グラフに含まれる二次元/三次元構造情報をより適切に特徴づけて利用するために、SMILES の代わりに分子グラフをモデル入力として使用するグラフツーシーケンス (Graph2Seq) 手法がこの分野で徐々に登場してきました。分子グラフの追加の構造情報が徐々に明らかになり、SMILES 配列に埋め込まれた配列間メソッド。どちらの方法でも、分子グラフからの豊富な構造特徴をうまく利用できます。
これに基づいて、この論文は、新しいグラフからシーケンスへの方法に基づいており、元の SMILES ベースのモデルで逆合成と順反応を組み合わせています。予測タスクの同時トレーニングの関連探索ベンチマークに基づいて、このタイプのデュアルタスク モデルの構築と実験をさらに包括的に探索し、実行中にモデルによって表示される難易度の不均衡と Top-k マッチングを事前に探索および分析します。トレーニング プロセス レート変動の問題; これに基づいて構築された BiG2S モデルは、主流のデータセットにおける逆合成および順反応予測タスクをより適切に処理でき、データ拡張を使用せずに他のテンプレートフリー逆合成モデルと一致する結果を達成できます。能力
全体的なフレームワークを書き直す必要があるBiG2S の全体的な構造は、図 1 に示すように、エンドツーエンドのエンコーダー/デコーダーです。エンコーダ側は、ローカルの有向メッセージ パッシング グラフ ネットワークと、グラフ構造のバイアス情報を組み込んだグローバル グラフ Transformer を使用して、最終的な分子グラフ ノード表現を生成します。デコーダは、標準の Transformer デコーダを使用して、自己回帰的にターゲット分子の SMILES シーケンスを生成します。逆合成と順反応予測を同時に学習するには、デコーダへの入力が必要であることに注意してください。さらに、位置情報のデュアルタスク ラベリングが含まれます。同時に、デコーダ側の正規化層と最終線形層には 2 つのパラメータ セットがあり、それぞれ逆合成タスクと順反応予測タスクを学習するために使用されます
図 1: BiG2S の全体的なフレームワーク図
逆合成と順反応予測は 2 つの関連タスクです。逆合成タスクは生成物を入力として使用し、反応物をターゲット出力として使用しますが、順反応予測タスクはその逆を行います。これら 2 つのタスクは、逆合成タスクの入力とターゲット出力を交換することで順反応予測タスクに変換できるため、密接な関係があります。
したがって、SMILES に基づく一部のテンプレートフリー モデルには、逆合成と正反応予測を訓練目標として化学反応の理解を高める試みを行い、一定の成果をあげた。この考えに基づいて、著者はさらに、グラフからシーケンスへのモデルにデュアルタスク トレーニングを導入しようとしました。
具体的には、著者は、以前に他の手法で使用されていたパラメータ共有戦略に基づいて、正規化層でデコーダと 2 セットのタスク固有パラメータが最後の線形層内に構築されます。他のモジュールでは、2 種類のタスクは一連のパラメーターを共有します。同時に、追加のデュアルタスク ラベルが入力分子グラフ ノードとデコーダーの最初の入力シーケンスに追加されます。このようにして、モデル全体のサイズを制御しながらも、モデルは 2 種類のタスクを区別し、それらの異なるデータ分布を学習することができます。
トレーニングと推論の最適化が必要です
著者はトレーニング プロセス中にモデルに反映された 2 種類の問題をさらに記録して分析しました。
最初に、著者は USPTO-50k のさまざまな SMILES 文字の出現頻度を記録しました。予測精度とトレーニング中の対応する予測精度を図 2 に示します。トレーニング プロセス中、トレーニング セット内でそれぞれ 0.4% と 0.3% を占める S と Br について、全体的な予測精度の絶対差は 8% に達しました。これは、異なる分子構造/フラグメント間で予測の難しさに明らかな違いがあることを最初に示しています。そのため、著者は不平衡損失関数 (焦点損失など) を導入することでそのような問題を軽減し、モデルがより多くの注意を払うことができるようにします。低分子フラグメント
図 2: USPTO-50k トレーニング セットにおける、さまざまな SMILES キャラクターの出現頻度とトレーニング中の全体的な予測精度
さらに、図 3 に示すように、著者はトレーニング中に検証セット上でモデルの予測結果の品質の変化も記録しました。著者は、USPTO-50k データセットの中期および後期のトレーニング段階で、検証セット上のモデルのトップ 1 の精度は依然として向上しているが、トップ 3、トップの予測品質が低下していることを発見しました。 -5、およびトップ 10 の大幅な減少
モデルのトップ 10 の反応物生成結果の全体的な品質を維持しながら、モデルのトップ 1 の予測品質を向上させるために、一種のモデル統合を追加で構築しました。カスタム評価指標に基づいた戦略。具体的には、モデルを保存するためのキューを構築し、事前定義された評価指標 (Top-1 精度、加重 Top-k 精度など) に従って保存されたモデルを並べ替えます。トレーニング プロセス全体を通じて、候補モデルを動的に保存し、キュー内の上位 3 ~ 5 に基づいてアンサンブル モデルを自動的に生成することで、最高の予測品質を持つ上位 k モデルを保持します。推論段階では、モデル Top-k
デュアルタスク実験にはベンチマークデータセットが必要です
著者は、50,000、 500,000 および 100 万の化学反応データ。USPTO に準拠。実験では、デュアルタスクモデルとシングルタスクモデルの性能を比較しました。図 4 のテスト結果によると、
小規模データセットでは、BiG2S はデュアルタスクトレーニングに基づく逆合成タスクで最高の予測精度を達成し、同時に高い順反応予測精度も維持しました。 , 順方向応答予測に偏った USPTO-MIT データセットと大規模データセット USPTO-full では、モデル全体のパラメーター量の制限により、デュアルタスク トレーニング後のモデルのパフォーマンスが低下します。減少しました。それにもかかわらず、逆合成タスクと順反応予測タスクを同時に処理する能力は、ほぼ同じ数のパラメーターと応答予測能力のわずかな低下を伴うデュアルタスク モデルから得られました(Top-k 精度の絶対差は約機能の観点から見ると、BiG2S モデルは期待された目標を達成しました
アブレーション実験の再分析
著者は、アブレーション実験を通じて不均衡損失を使用した後、さまざまなデータセットで予測する際の、新しいビーム検索アルゴリズムと BiG2S の最適温度ハイパーパラメーターをさらに検証しました。ここでの温度ハイパーパラメータは、出力確率分布を制御するために Softmax で使用される温度パラメータ T を指します。実験結果を図 5 と図 6 に示します。
ビーム探索アルゴリズムの実験では、OpenNMT は探索幅を 3 倍に拡大したが、探索時間は 1.74 倍にしか拡大しなかったことがわかります。新しいビーム探索アルゴリズムの上位 1 位の精度が OpenNMT と一致する場合、全体の探索時間は 1 ~ 2 倍増加しますが、上位 10 位の予測結果の品質に関しては、新しいビーム探索アルゴリズムはOpenNMT と比較して少なくとも 3% の向上 絶対精度の利点と有効分子比率の利点 2% 新しいビーム探索アルゴリズムにより、モデルの全体的な Top-k 探索結果の品質が大幅に向上したと言えます。検索時間のコスト。
温度について 研究者らは、ハイパーパラメーターの実験を行った際、小規模のデータセットでより大きな温度パラメーターを使用すると、全体的な Top-k 予測精度が大幅に向上する可能性があることを発見しました。大きなデータセットでは、BiG2S モデル サイズがすべての反応データに完全に適応できないため、この時点でより小さい温度パラメーターを選択すると、多くの場合モデル検索に役立ちます
研究の結論は次のとおりです...
この記事では、著者は、逆合成タスクと順反応予測タスクの両方を処理できる、BiG2S と呼ばれるテンプレートフリーの反応予測モデルを提案します。適切なパラメーター共有戦略と追加のデュアルタスクラベルを採用することで、BiG2S は、異なるサイズのデータセットに対して、より少ないパラメーターで逆合成タスクと反応予測タスクを完了することができ、その全体的な予測能力は主流モデルに匹敵します
さまざまなSMILESキャラクターの不均一な予測難易度およびモデルトレーニングにおけるTop-k予測精度の変動の問題を解決するために、著者は、不均衡損失、カスタム評価指標に基づく自動モデル統合戦略、および新しいフレームワークに基づくビーム探索アルゴリズムを導入しました。これらの問題を軽減するために、
BiG2S は、サイズの異なる 3 つの主流データセットで優れたデュアルタスク予測機能を示し、さらなるアブレーション実験では、追加で導入されたトレーニングおよび推論戦略の有効性も証明しました。
以上がデュアルタスクに基づくエンドツーエンドのテンプレート不要の応答予測モデルの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

ホットAIツール

Undresser.AI Undress
リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover
写真から衣服を削除するオンライン AI ツール。

Undress AI Tool
脱衣画像を無料で

Clothoff.io
AI衣類リムーバー

AI Hentai Generator
AIヘンタイを無料で生成します。

人気の記事

ホットツール

メモ帳++7.3.1
使いやすく無料のコードエディター

SublimeText3 中国語版
中国語版、とても使いやすい

ゼンドスタジオ 13.0.1
強力な PHP 統合開発環境

ドリームウィーバー CS6
ビジュアル Web 開発ツール

SublimeText3 Mac版
神レベルのコード編集ソフト(SublimeText3)

ホットトピック









以前に書きましたが、今日は、深層学習テクノロジーが複雑な環境におけるビジョンベースの SLAM (同時ローカリゼーションとマッピング) のパフォーマンスをどのように向上させることができるかについて説明します。ここでは、深部特徴抽出と深度マッチング手法を組み合わせることで、低照度条件、動的照明、テクスチャの弱い領域、激しいセックスなどの困難なシナリオでの適応を改善するように設計された多用途のハイブリッド ビジュアル SLAM システムを紹介します。当社のシステムは、拡張単眼、ステレオ、単眼慣性、ステレオ慣性構成を含む複数のモードをサポートしています。さらに、他の研究にインスピレーションを与えるために、ビジュアル SLAM と深層学習手法を組み合わせる方法も分析します。公開データセットと自己サンプリングデータに関する広範な実験を通じて、測位精度と追跡堅牢性の点で SL-SLAM の優位性を実証しました。

現代の製造において、正確な欠陥検出は製品の品質を確保するための鍵であるだけでなく、生産効率を向上させるための核心でもあります。ただし、既存の欠陥検出データセットには、実際のアプリケーションに必要な精度や意味論的な豊富さが欠けていることが多く、その結果、モデルが特定の欠陥カテゴリや位置を識別できなくなります。この問題を解決するために、広州香港科技大学と Simou Technology で構成されるトップの研究チームは、産業欠陥に関する詳細かつ意味的に豊富な大規模なアノテーションを提供する「DefectSpectrum」データセットを革新的に開発しました。表 1 に示すように、他の産業データ セットと比較して、「DefectSpectrum」データ セットは最も多くの欠陥注釈 (5438 個の欠陥サンプル) と最も詳細な欠陥分類 (125 個の欠陥カテゴリ) を提供します。

オープンな LLM コミュニティは百花繚乱の時代です Llama-3-70B-Instruct、QWen2-72B-Instruct、Nemotron-4-340B-Instruct、Mixtral-8x22BInstruct-v0.1 などがご覧いただけます。優秀なパフォーマーモデル。しかし、GPT-4-Turboに代表される独自の大型モデルと比較すると、オープンモデルには依然として多くの分野で大きなギャップがあります。一般的なモデルに加えて、プログラミングと数学用の DeepSeek-Coder-V2 や視覚言語タスク用の InternVL など、主要な領域に特化したいくつかのオープン モデルが開発されています。

AI にとって、数学オリンピックはもはや問題ではありません。木曜日、Google DeepMind の人工知能は、AI を使用して今年の国際数学オリンピック IMO の本当の問題を解決するという偉業を達成し、金メダル獲得まであと一歩のところまで迫りました。先週終了したばかりの IMO コンテストでは、代数、組合せ論、幾何学、数論を含む 6 つの問題が出題されました。 Googleが提案したハイブリッドAIシステムは4問正解で28点を獲得し、銀メダルレベルに達した。今月初め、UCLA 終身教授のテレンス・タオ氏が、100 万ドルの賞金をかけて AI 数学オリンピック (AIMO Progress Award) を宣伝したばかりだったが、予想外なことに、AI の問題解決のレベルは 7 月以前にこのレベルまで向上していた。 IMO に関する質問を同時に行うのが最も難しいのは、最も歴史が長く、規模が最も大きく、最も否定的な IMO です。

編集者 |KX 今日に至るまで、単純な金属から大きな膜タンパク質に至るまで、結晶学によって決定される構造の詳細と精度は、他のどの方法にも匹敵しません。しかし、最大の課題、いわゆる位相問題は、実験的に決定された振幅から位相情報を取得することのままです。デンマークのコペンハーゲン大学の研究者らは、結晶相の問題を解決するための PhAI と呼ばれる深層学習手法を開発しました。数百万の人工結晶構造とそれに対応する合成回折データを使用して訓練された深層学習ニューラル ネットワークは、正確な電子密度マップを生成できます。この研究では、この深層学習ベースの非経験的構造解法は、従来の非経験的計算法とは異なり、わずか 2 オングストロームの解像度で位相問題を解決できることが示されています。これは、原子解像度で利用可能なデータのわずか 10% ~ 20% に相当します。

編集者 | ScienceAI 限られた臨床データに基づいて、何百もの医療アルゴリズムが承認されています。科学者たちは、誰がツールをテストすべきか、そしてどのようにテストするのが最善かについて議論しています。デビン シン氏は、救急治療室で小児患者が治療を長時間待っている間に心停止に陥るのを目撃し、待ち時間を短縮するための AI の応用を模索するようになりました。 SickKids 緊急治療室からのトリアージ データを使用して、Singh 氏らは潜在的な診断を提供し、検査を推奨する一連の AI モデルを構築しました。ある研究では、これらのモデルにより医師の診察が 22.3% 短縮され、医療検査が必要な患者 1 人あたりの結果の処理が 3 時間近く高速化できることが示されました。ただし、研究における人工知能アルゴリズムの成功は、これを証明するだけです。

編集者 |ScienceAI 質問応答 (QA) データセットは、自然言語処理 (NLP) 研究を促進する上で重要な役割を果たします。高品質の QA データ セットは、モデルの微調整に使用できるだけでなく、大規模言語モデル (LLM) の機能、特に科学的知識を理解し推論する能力を効果的に評価することもできます。現在、医学、化学、生物学、その他の分野をカバーする多くの科学 QA データ セットがありますが、これらのデータ セットにはまだいくつかの欠点があります。まず、データ形式は比較的単純で、そのほとんどが多肢選択式の質問であり、評価は簡単ですが、モデルの回答選択範囲が制限され、科学的な質問に回答するモデルの能力を完全にテストすることはできません。対照的に、自由回答型の Q&A

2023 年には、AI のほぼすべての分野が前例のない速度で進化しています。同時に、AI は身体化されたインテリジェンスや自動運転などの主要な分野の技術的限界を押し広げています。マルチモーダルの流れのもと、AI大型モデルの主流アーキテクチャとしてのTransformerの状況は揺るがされるだろうか? MoE (専門家混合) アーキテクチャに基づく大規模モデルの検討が業界の新しいトレンドになっているのはなぜですか?ラージ ビジョン モデル (LVM) は、一般的な視覚における新たなブレークスルーとなる可能性がありますか? ...過去 6 か月間にリリースされたこのサイトの 2023 PRO メンバー ニュースレターから、上記の分野の技術トレンドと業界の変化を詳細に分析し、新しい分野での目標を達成するのに役立つ 10 の特別な解釈を選択しました。準備してください。この解釈は 2023 年の Week50 からのものです
