RNA創薬の画期的な初のRNA基本モデル、10億ヌクレオチド以上のレベルでの測定技術を明らかに

編集者 | KX
最近、バイオテクノロジー企業 Atomic AI は、化学マッピング データを利用した初の大規模言語モデル (LLM) の開発に成功したと発表しました。 Atomic AI は、高度な機械学習技術と最新の構造生物学を組み合わせて、RNA 創薬の謎を解き明かします
Atomic AI の研究者は、大規模化学物質の社内カスタム湿式研究室分析を活用する新しいプラットフォーム コンポーネントを作成しました。収集されたマッピングデータ。科学者らは数百万のRNA配列に関するデータを収集し、10億以上のヌクレオチドレベルの測定を行った。このデータに基づいてトレーニングされた ATOM-1 は、RNA についての豊富な理解を深め、さまざまな RNA パターンの特性を最適化するために使用できます。
Atomic AI が 12 月 14 日に記事を公開しました プレプリント論文「ATOM-1: 化学地図データに基づく RNA の構造と機能の基本モデル」が bioRxiv に公開されました。この論文では、Atomic AI の独自の ATOM-1™ プラットフォーム コンポーネントについて詳しく説明します。この基本モデルは RNA の構造と機能を正確に予測でき、RNA 治療薬の開発を改善する上で重要な役割を果たします
マンジュナス・ラマラオ博士、最高科学責任者Atomic AI は次のように述べています:
「ATOM-1 は、RNA の構造的および機能的側面と、小分子、mRNA ワクチン、siRNA、環状RNA などの RNA パターンの主要な特徴を予測できます。 「RNA、治療設計の効率化を支援します。私たちの目標は、合理化された創薬プロセスを作成して独自のパイプラインを前進させ、パートナーと協力してRNAターゲットとツールの検証を支援し、最終的に必要な治療を迅速かつ効果的に患者に提供することです。」
Atomic AI の創設科学者であり機械学習担当ディレクターであるステファン・アイスマン博士は次のように述べています:
「RNA ヌクレオチド修飾と次世代シークエンシングに基づいた大規模なデータセットを構築することにより、Atomic AI チームは初の RNA ベースのモデルを作成しました。私たちは、RNA 研究の他の側面へのモデルの広範な適用と、最適化におけるその使用に興奮しています。」 RNA ベースの医薬品。私たちは、mRNA ワクチンの安定性と翻訳効率、siRNA の活性と毒性など、さまざまな特性の可能性に興奮しています。」
化学マップ データでトレーニングされた初の RNA ベースのモデル
この設計課題に対処するために、Atomic AI は、機械学習トレーニング用に特別に開発されたデータ収集戦略を通じて、化学マップ データでトレーニングされた初の RNA ベースのモデルである ATOM-1 を立ち上げました。 ATOM-1 埋め込みの上に小さなプローブ ニューラル ネットワークを使用して、このモデルが RNA の豊富な内部表現を開発したことを実証します。限られた量の追加データでトレーニングされたこれらの小規模ネットワークは、主要な RNA 予測タスクで最先端の精度を達成し、このアプローチが RNA 分野全体にわたる治療設計を可能にする可能性があることを実証しました。
ATOM-1 は、以前に公開された方法よりも正確に RNA の二次構造と三次構造を予測できます
注目すべきことに、ワクチン設計のための ATOM-1 と他の計算ツールを比較した遡及的分析では、ATOM-1 は溶液中の mRNA の安定性を予測する他の 1,600 の方法すべてを上回っていました。これらの結果に基づいて、限られたデータを使用して新しい基礎モデルを適応させて RNA のさまざまな特性を予測することができ、RNA の構造を決定するだけでなく、RNA 治療薬の他の重要な特徴も予測できます。
過去 2 年半にわたり、私たちは基礎となるモデルをトレーニングするためのデータを意図的に設計し、収集してきました、と「Atomic AI」の創設者兼 CEO のラファエル・タウンゼント博士は述べています。 「機械学習と生成人工知能を通じて、少数の初期データポイントから RNA の構造と機能を高精度で予測するように ATOM-1 を調整できる、またとない機会が得られました。」
#倴サイエンス カバー、Atomic AI 独自の AI 駆動 3D RNA 構造エンジン
Atomic AI は、2021 年 5 月に設立され、サンフランシスコ ベイエリアに本社を置く新興バイオテクノロジー企業です。同社は、機械学習と構造生物学の融合を活用して RNA 創薬を前進させることに重点を置いています。彼らは、基本的な深層学習モデルを活用して、RNA をターゲットとする低分子、RNA ベースの薬剤、および RNA ツールを探索および設計する独自のプラットフォームを開発しましたAtomic AI のテクノロジー「RNA 構造の幾何学的深層学習」の関連記事"("Geometric Deep Learning of RNA Structure") が Science 誌の表紙に掲載されました。以上がRNA創薬の画期的な初のRNA基本モデル、10億ヌクレオチド以上のレベルでの測定技術を明らかにの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

ホットAIツール

Undresser.AI Undress
リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover
写真から衣服を削除するオンライン AI ツール。

Undress AI Tool
脱衣画像を無料で

Clothoff.io
AI衣類リムーバー

AI Hentai Generator
AIヘンタイを無料で生成します。

人気の記事

ホットツール

メモ帳++7.3.1
使いやすく無料のコードエディター

SublimeText3 中国語版
中国語版、とても使いやすい

ゼンドスタジオ 13.0.1
強力な PHP 統合開発環境

ドリームウィーバー CS6
ビジュアル Web 開発ツール

SublimeText3 Mac版
神レベルのコード編集ソフト(SublimeText3)

ホットトピック











現代の製造において、正確な欠陥検出は製品の品質を確保するための鍵であるだけでなく、生産効率を向上させるための核心でもあります。ただし、既存の欠陥検出データセットには、実際のアプリケーションに必要な精度や意味論的な豊富さが欠けていることが多く、その結果、モデルが特定の欠陥カテゴリや位置を識別できなくなります。この問題を解決するために、広州香港科技大学と Simou Technology で構成されるトップの研究チームは、産業欠陥に関する詳細かつ意味的に豊富な大規模なアノテーションを提供する「DefectSpectrum」データセットを革新的に開発しました。表 1 に示すように、他の産業データ セットと比較して、「DefectSpectrum」データ セットは最も多くの欠陥注釈 (5438 個の欠陥サンプル) と最も詳細な欠陥分類 (125 個の欠陥カテゴリ) を提供します。

オープンな LLM コミュニティは百花繚乱の時代です Llama-3-70B-Instruct、QWen2-72B-Instruct、Nemotron-4-340B-Instruct、Mixtral-8x22BInstruct-v0.1 などがご覧いただけます。優秀なパフォーマーモデル。しかし、GPT-4-Turboに代表される独自の大型モデルと比較すると、オープンモデルには依然として多くの分野で大きなギャップがあります。一般的なモデルに加えて、プログラミングと数学用の DeepSeek-Coder-V2 や視覚言語タスク用の InternVL など、主要な領域に特化したいくつかのオープン モデルが開発されています。

AI にとって、数学オリンピックはもはや問題ではありません。木曜日、Google DeepMind の人工知能は、AI を使用して今年の国際数学オリンピック IMO の本当の問題を解決するという偉業を達成し、金メダル獲得まであと一歩のところまで迫りました。先週終了したばかりの IMO コンテストでは、代数、組合せ論、幾何学、数論を含む 6 つの問題が出題されました。 Googleが提案したハイブリッドAIシステムは4問正解で28点を獲得し、銀メダルレベルに達した。今月初め、UCLA 終身教授のテレンス・タオ氏が、100 万ドルの賞金をかけて AI 数学オリンピック (AIMO Progress Award) を宣伝したばかりだったが、予想外なことに、AI の問題解決のレベルは 7 月以前にこのレベルまで向上していた。 IMO に関する質問を同時に行うのが最も難しいのは、最も歴史が長く、規模が最も大きく、最も否定的な IMO です。

編集者 |ScienceAI 質問応答 (QA) データセットは、自然言語処理 (NLP) 研究を促進する上で重要な役割を果たします。高品質の QA データ セットは、モデルの微調整に使用できるだけでなく、大規模言語モデル (LLM) の機能、特に科学的知識を理解し推論する能力を効果的に評価することもできます。現在、医学、化学、生物学、その他の分野をカバーする多くの科学 QA データ セットがありますが、これらのデータ セットにはまだいくつかの欠点があります。まず、データ形式は比較的単純で、そのほとんどが多肢選択式の質問であり、評価は簡単ですが、モデルの回答選択範囲が制限され、科学的な質問に回答するモデルの能力を完全にテストすることはできません。対照的に、自由回答型の Q&A

編集者 | ScienceAI 限られた臨床データに基づいて、何百もの医療アルゴリズムが承認されています。科学者たちは、誰がツールをテストすべきか、そしてどのようにテストするのが最善かについて議論しています。デビン シン氏は、救急治療室で小児患者が治療を長時間待っている間に心停止に陥るのを目撃し、待ち時間を短縮するための AI の応用を模索するようになりました。 SickKids 緊急治療室からのトリアージ データを使用して、Singh 氏らは潜在的な診断を提供し、検査を推奨する一連の AI モデルを構築しました。ある研究では、これらのモデルにより医師の診察が 22.3% 短縮され、医療検査が必要な患者 1 人あたりの結果の処理が 3 時間近く高速化できることが示されました。ただし、研究における人工知能アルゴリズムの成功は、これを証明するだけです。

編集者 |KX 今日に至るまで、単純な金属から大きな膜タンパク質に至るまで、結晶学によって決定される構造の詳細と精度は、他のどの方法にも匹敵しません。しかし、最大の課題、いわゆる位相問題は、実験的に決定された振幅から位相情報を取得することのままです。デンマークのコペンハーゲン大学の研究者らは、結晶相の問題を解決するための PhAI と呼ばれる深層学習手法を開発しました。数百万の人工結晶構造とそれに対応する合成回折データを使用して訓練された深層学習ニューラル ネットワークは、正確な電子密度マップを生成できます。この研究では、この深層学習ベースの非経験的構造解法は、従来の非経験的計算法とは異なり、わずか 2 オングストロームの解像度で位相問題を解決できることが示されています。これは、原子解像度で利用可能なデータのわずか 10% ~ 20% に相当します。

編集者 | KX 医薬品の研究開発の分野では、タンパク質とリガンドの結合親和性を正確かつ効果的に予測することが、医薬品のスクリーニングと最適化にとって重要です。しかし、現在の研究では、タンパク質とリガンドの相互作用における分子表面情報の重要な役割が考慮されていません。これに基づいて、アモイ大学の研究者らは、初めてタンパク質の表面、3D 構造、配列に関する情報を組み合わせ、クロスアテンション メカニズムを使用して異なるモダリティの特徴を比較する、新しいマルチモーダル特徴抽出 (MFE) フレームワークを提案しました。アライメント。実験結果は、この方法がタンパク質-リガンド結合親和性の予測において最先端の性能を達成することを実証しています。さらに、アブレーション研究は、この枠組み内でのタンパク質表面情報と多峰性特徴の位置合わせの有効性と必要性を実証しています。 「S」で始まる関連研究

著者 | 編集者 Bai Fan、香港中文大学 | ScienceAI 最近、香港中文大学と Zhiyuan は、3D 医療画像を促進するために M3D-Data、M3D-LaMed、M3D-Bench を含む一連の研究を共同提案しました。データセット、モデル、評価のあらゆる側面からの分析の開発。 (1) M3D-Data は現在最大の 3D 医用画像データ セットであり、M3D-Cap (120K3D 画像とテキストのペア)、M3D-VQA (510K の質問と回答のペア)、M3D-Seg (150K3DMask)、M3D-RefSeg ( 3K 推論セグメンテーション ) 合計 4 つのサブデータセット。 (2) M3D-LaMed は現在、最も汎用性の高い 3D 医療マルチモーダル大型モデルです。
