中国科学院のチームがAI大型モデルトレーニング技術を利用して大量の放射光データを処理
元の意味を変えることなく、中国語に書き直す必要がある文は次のとおりです: 編集| これは、理論的に回折限界の解像度を達成できるコヒーレント回折イメージング技術であり、広く普及しています。材料、生命、半導体、エネルギーなどさまざまな科学分野の研究に活用されています。
新世代の放射光光源は、高コヒーレンスかつ高輝度の X 線を提供でき、高スループットおよび多次元の方向でコヒーレントイメージング技術の開発を促進し、微細構造のタイコグラフィーを有用にします。大量サンプルの研究と機能特性評価に優れた応用の可能性を秘めています。しかし、新しい実験モデルと応用シナリオは、大規模データのオンライン分析に技術的な課題をもたらしており、1 回の実験で得られる元の回折パターン データの量は PB レベルに達する可能性があり、4 日に科学実験における最大のデータ ソースの 1 つになりました。 -世代放射光光源の一つ。また、その位相回復問題は、放射光データ処理分野における最も難しい問題の一つでもある。
人工知能手法は、ビッグ データの分析と処理のための強力なツールとして、従来のアルゴリズムの利点を維持し、大量の実験データのオンライン分析におけるその機能を際立たせます。
比較的時間のかかるスキャン イメージング テクノロジーであるタイコグラフィーの主な目標の 1 つは、リアルタイム分析を可能にすることです。しかし、現在の伝統的なタイコグラフィー再構成アルゴリズムでは、オンライン再構成のニーズを満たすことは困難です。研究チームは、畳み込みニューラルネットワークに基づいて、ネットワークのトレーニングと再構築を高速化し、再構築効果を向上させるグループ化畳み込みニューラルネットワークデコーダ構造を提案しました。ニューラル ネットワークは、回折パターンから実際のオブジェクトへのマッピングを学習できます。今後、光源データの量と質がさらに向上することにより、ネットワーク規模、パラメータ量、学習データ量がさらに増加し、ネットワークの性能と汎化能力が向上すると考えられます。 中国科学院の高エネルギー放射源 (HEPS) ビームライン ソフトウェア チームは、X 線タイコグラフィーの実験データからオブジェクトを正確に復元するために、PtyNet と呼ばれる畳み込みニューラル ネットワーク フレームワークを開発しました。投影。強力なコンピューティング クラスターのサポートにより、PtyNet はトレーニング用に放射光光源からデータを迅速に取得し、ユーザーの実験データの画像を迅速に再構成できます
図 1
この研究のタイトルは「大規模な事前トレーニング済み深層学習モデルの微調整による効率的なタイコグラフィー再構築戦略」で、2023 年 11 月 9 日に iScience 誌に掲載されました
論文リンク:
異なる実験データによって回収されたターゲットオブジェクトが異なるため、チームは微調整戦略も導入し、さらに最適化しましたネットワークパラメータ。教師なし微調整戦略により、ネットワークはより強力な汎化能力とより高い再構成解像度を得ることができます。シンクロトロン放射線源は、より強力な事前トレーニング済みモデルを取得するのに十分なデータをネットワークに提供できます。ネットワーク内に存在しない新しいサンプルであっても、ネットワークを正常に再構築できます (図 2)。
書き直す必要があるのは、2 番目の図です。
将来的に、チームは畳み込みニューラル ネットワークを X 線コヒーレンス イメージングに適用し続ける予定です。フィールドでの研究。微調整と大規模モデル戦略を使用して、コヒーレント イメージングの大規模モデルが開発されました。モデル自体は、さまざまなイメージング タスクを識別し、回復結果を提供できます。ユーザーは、リアルタイムの再構築のためにいくつかの路線駅パラメータを入力するだけで済みます。
将来のEBスケールデータの課題に直面して、HEPSは「大規模科学ソフトウェアフレームワークAI for Science」という革新的な科学研究パラダイムを積極的に推進しており、専門的な科学ソフトウェアチームを設立して、実験制御、データ収集と処理などの大規模なクロスフィールド研究、人工知能、最先端の主題アルゴリズム、マルチスケール画像処理およびデータマイニングが「スマート光源」構築の基礎を築きました。
以上が中国科学院のチームがAI大型モデルトレーニング技術を利用して大量の放射光データを処理の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

ホットAIツール

Undresser.AI Undress
リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover
写真から衣服を削除するオンライン AI ツール。

Undress AI Tool
脱衣画像を無料で

Clothoff.io
AI衣類リムーバー

AI Hentai Generator
AIヘンタイを無料で生成します。

人気の記事

ホットツール

メモ帳++7.3.1
使いやすく無料のコードエディター

SublimeText3 中国語版
中国語版、とても使いやすい

ゼンドスタジオ 13.0.1
強力な PHP 統合開発環境

ドリームウィーバー CS6
ビジュアル Web 開発ツール

SublimeText3 Mac版
神レベルのコード編集ソフト(SublimeText3)

ホットトピック









現代の製造において、正確な欠陥検出は製品の品質を確保するための鍵であるだけでなく、生産効率を向上させるための核心でもあります。ただし、既存の欠陥検出データセットには、実際のアプリケーションに必要な精度や意味論的な豊富さが欠けていることが多く、その結果、モデルが特定の欠陥カテゴリや位置を識別できなくなります。この問題を解決するために、広州香港科技大学と Simou Technology で構成されるトップの研究チームは、産業欠陥に関する詳細かつ意味的に豊富な大規模なアノテーションを提供する「DefectSpectrum」データセットを革新的に開発しました。表 1 に示すように、他の産業データ セットと比較して、「DefectSpectrum」データ セットは最も多くの欠陥注釈 (5438 個の欠陥サンプル) と最も詳細な欠陥分類 (125 個の欠陥カテゴリ) を提供します。

オープンな LLM コミュニティは百花繚乱の時代です Llama-3-70B-Instruct、QWen2-72B-Instruct、Nemotron-4-340B-Instruct、Mixtral-8x22BInstruct-v0.1 などがご覧いただけます。優秀なパフォーマーモデル。しかし、GPT-4-Turboに代表される独自の大型モデルと比較すると、オープンモデルには依然として多くの分野で大きなギャップがあります。一般的なモデルに加えて、プログラミングと数学用の DeepSeek-Coder-V2 や視覚言語タスク用の InternVL など、主要な領域に特化したいくつかのオープン モデルが開発されています。

編集者 |KX 今日に至るまで、単純な金属から大きな膜タンパク質に至るまで、結晶学によって決定される構造の詳細と精度は、他のどの方法にも匹敵しません。しかし、最大の課題、いわゆる位相問題は、実験的に決定された振幅から位相情報を取得することのままです。デンマークのコペンハーゲン大学の研究者らは、結晶相の問題を解決するための PhAI と呼ばれる深層学習手法を開発しました。数百万の人工結晶構造とそれに対応する合成回折データを使用して訓練された深層学習ニューラル ネットワークは、正確な電子密度マップを生成できます。この研究では、この深層学習ベースの非経験的構造解法は、従来の非経験的計算法とは異なり、わずか 2 オングストロームの解像度で位相問題を解決できることが示されています。これは、原子解像度で利用可能なデータのわずか 10% ~ 20% に相当します。

AI にとって、数学オリンピックはもはや問題ではありません。木曜日、Google DeepMind の人工知能は、AI を使用して今年の国際数学オリンピック IMO の本当の問題を解決するという偉業を達成し、金メダル獲得まであと一歩のところまで迫りました。先週終了したばかりの IMO コンテストでは、代数、組合せ論、幾何学、数論を含む 6 つの問題が出題されました。 Googleが提案したハイブリッドAIシステムは4問正解で28点を獲得し、銀メダルレベルに達した。今月初め、UCLA 終身教授のテレンス・タオ氏が、100 万ドルの賞金をかけて AI 数学オリンピック (AIMO Progress Award) を宣伝したばかりだったが、予想外なことに、AI の問題解決のレベルは 7 月以前にこのレベルまで向上していた。 IMO に関する質問を同時に行うのが最も難しいのは、最も歴史が長く、規模が最も大きく、最も否定的な IMO です。

編集者 | ScienceAI 限られた臨床データに基づいて、何百もの医療アルゴリズムが承認されています。科学者たちは、誰がツールをテストすべきか、そしてどのようにテストするのが最善かについて議論しています。デビン シン氏は、救急治療室で小児患者が治療を長時間待っている間に心停止に陥るのを目撃し、待ち時間を短縮するための AI の応用を模索するようになりました。 SickKids 緊急治療室からのトリアージ データを使用して、Singh 氏らは潜在的な診断を提供し、検査を推奨する一連の AI モデルを構築しました。ある研究では、これらのモデルにより医師の診察が 22.3% 短縮され、医療検査が必要な患者 1 人あたりの結果の処理が 3 時間近く高速化できることが示されました。ただし、研究における人工知能アルゴリズムの成功は、これを証明するだけです。

編集者 |ScienceAI 質問応答 (QA) データセットは、自然言語処理 (NLP) 研究を促進する上で重要な役割を果たします。高品質の QA データ セットは、モデルの微調整に使用できるだけでなく、大規模言語モデル (LLM) の機能、特に科学的知識を理解し推論する能力を効果的に評価することもできます。現在、医学、化学、生物学、その他の分野をカバーする多くの科学 QA データ セットがありますが、これらのデータ セットにはまだいくつかの欠点があります。まず、データ形式は比較的単純で、そのほとんどが多肢選択式の質問であり、評価は簡単ですが、モデルの回答選択範囲が制限され、科学的な質問に回答するモデルの能力を完全にテストすることはできません。対照的に、自由回答型の Q&A

2023 年には、AI のほぼすべての分野が前例のない速度で進化しています。同時に、AI は身体化されたインテリジェンスや自動運転などの主要な分野の技術的限界を押し広げています。マルチモーダルの流れのもと、AI大型モデルの主流アーキテクチャとしてのTransformerの状況は揺るがされるだろうか? MoE (専門家混合) アーキテクチャに基づく大規模モデルの検討が業界の新しいトレンドになっているのはなぜですか?ラージ ビジョン モデル (LVM) は、一般的な視覚における新たなブレークスルーとなる可能性がありますか? ...過去 6 か月間にリリースされたこのサイトの 2023 PRO メンバー ニュースレターから、上記の分野の技術トレンドと業界の変化を詳細に分析し、新しい分野での目標を達成するのに役立つ 10 の特別な解釈を選択しました。準備してください。この解釈は 2023 年の Week50 からのものです

編集者 | KX 医薬品の研究開発の分野では、タンパク質とリガンドの結合親和性を正確かつ効果的に予測することが、医薬品のスクリーニングと最適化にとって重要です。しかし、現在の研究では、タンパク質とリガンドの相互作用における分子表面情報の重要な役割が考慮されていません。これに基づいて、アモイ大学の研究者らは、初めてタンパク質の表面、3D 構造、配列に関する情報を組み合わせ、クロスアテンション メカニズムを使用して異なるモダリティの特徴を比較する、新しいマルチモーダル特徴抽出 (MFE) フレームワークを提案しました。アライメント。実験結果は、この方法がタンパク質-リガンド結合親和性の予測において最先端の性能を達成することを実証しています。さらに、アブレーション研究は、この枠組み内でのタンパク質表面情報と多峰性特徴の位置合わせの有効性と必要性を実証しています。 「S」で始まる関連研究
