肉体労働から産業革命へ! Nature の記事: 深層学習によって革命を起こした生物学的画像解析の 5 つの分野
1立方ミリメートルというと、それほど大きくは感じられません。ゴマ粒ほどの大きさですが、人間の脳のこの小さな空間には、5万本の神経線で接続された約1億3,400万個のシナプスが収容できます。
生データを生成するには、生物学者は 連続超薄切片電子顕微鏡を使用して 11 か月以内にデータを分析する必要があります 数千の組織断片が画像化されます。
最終的に取得されたデータ量は、驚くべき1.4 ペタバイト (つまり 1400TB、約 200 万枚の CD-ROM の容量に相当) に達しました。 , これは単なる天文学的な数字です。
ハーバード大学の分子細胞生物学者ジェフ・リヒトマン氏は、純粋に手作業で行った場合、人間がすべての神経線を手動で追跡することは不可能であると述べました。実際にこの仕事を効果的に遂行できる人材は十分ではありません。顕微鏡技術の進歩により大量の画像データが得られるようになりましたが、データ量が多すぎて人手不足となっているのも、コネクトミクスの理由です。
(コネクトミクス、脳の構造と機能的接続をテーマとした研究)、および他の生物学分野における一般的な現象。 しかし コンピュータ サイエンス
の使命はまさに、この種の人材不足の問題 、特に最適化された 深度を解決することです。学習アルゴリズム は、大規模なデータセットから データ パターン をマイニングできます。 マサチューセッツ工科大学ブロード研究所とハーバード大学ケンブリッジの計算生物学者ベス・シミニ氏は、ディープラーニングはここ数年で生物学を大きく押し上げてきたと述べています。研究ツール。
以下は、Nature の編集者がディープラーニングによってもたらされる生物学的画像解析の 5 つの分野
を要約したものです。大規模コネクトミクス
深層学習により、研究者はショウジョウバエ、マウス、さらには人間からもますます複雑なコネクトームを生成できるようになります。これらのデータは、神経科学者が脳の仕組みや、発達や病気の際に脳の構造がどのように変化するかを理解するのに役立ちますが、神経接続をマッピングするのは簡単ではありません
。2018 年、リヒトマン
は、カリフォルニア州マウンテンビューでGoogleのコネクトミクスリーダーViren Jainと提携しました。チームが必要とする人工知能アルゴリズムのソリューションを見つけるため。 コネクトミクスにおける画像解析タスクは実際には非常に難しく、これらの細いワイヤー、細胞の軸索および樹状突起を長距離にわたって追跡できなければなりません。従来の画像このタスクでは処理メソッドに多くのエラーが発生するため、このタスクには基本的に役に立ちません
。これらの神経鎖は、1 ミクロンよりも細く、数百ミクロン、さらには数ミリメートルの組織に及ぶこともあります。
そして、ディープ ラーニング アルゴリズム
は、コネクトミクス データを自動的に分析できるだけでなく、非常に高い精度を維持することもできます。 研究者は、関心のある特徴を含む注釈付きデータセットを使用して、他のデータの同じ特徴を迅速に識別できる複雑な計算モデルをトレーニングできます。
欧州分子生物学研究所のコンピュータ科学者であるアンナ クレシュク氏は、深層学習アルゴリズムを使用するプロセスは「例を与える」ことに似ていると考えています。十分な例がある限り、 、すべての問題を解決できます すべて解決しました。
しかし、ディープラーニングを使用したとしても、リヒトマンとジェインのチームには、人間の大脳皮質のセグメントをマッピングするという難しい課題が残っていました。
データ収集段階では、5,000以上の超薄組織切片を採取するだけで
326日かかりました。 2 人の研究者 は、約 100 時間を費やして 画像に手動で注釈を付け、ニューロンを追跡して、アルゴリズムをトレーニングするためのグラウンド トゥルース データセットを作成しました。
標準データを使用してトレーニングされたアルゴリズムは、自動的に画像をつなぎ合わせ、ニューロンとシナプスを識別し、最終的なコネクトームを生成します。
Jain のチームは、この問題を解決するために、 数千のテンソル プロセッシング ユニット (TPU) を含む大量のコンピューティング リソースも投資し、また 数100 万 TPU 時間に必要なデータの前処理に数か月かかります。
研究者は現在収集されている 最大の データ セットを取得しており、それを非常に細かいレベルで再構成できますが、この 量のデータは約 0.0001% にすぎません。人間の脳
#アルゴリズムとハードウェアが向上するにつれて、研究者はより大きな脳領域をマッピングし、同時に細胞小器官やタンパク質などのより多くの細胞の特徴を解決できるようになるはずです。
少なくとも、ディープラーニングは実現可能性を提供します。
仮想組織学組織学 (組織学) は、化学的または分子染色に基づいて疾患を診断する医学における重要なツールです。
しかし、プロセス全体は時間と手間がかかり、通常は 完了するまでに数日、場合によっては数週間かかります。
生検は薄片にスライスされ、細胞および細胞内の特徴を明らかにするために染色され、病理学者は結果を読んで解釈します。
カリフォルニア大学ロサンゼルス校のコンピューターエンジニアであるアイドガン・オズカン氏は、ディープラーニングによってプロセス全体を高速化できると考えています。
彼は、カスタマイズされた深層学習モデルをトレーニングし、コンピュータ シミュレーションを使用して組織切片を染色し、同じ切片上で 数万の組織切片を染色しました。染色されたサンプルがモデルに供給され、モデルはサンプル間の差を計算します。 仮想染色の時間的な利点 (一瞬で完了できる) に加えて、病理学者は仮想染色と従来の染色の間にほとんど違いがないことを観察を通じて発見しました## #、プロの人も違いがわかりません。
実験結果は、このアルゴリズムが乳がんバイオマーカー HER2 の分子染色を 秒で再現できることを示しています。このプロセスは、通常、研究室が必要とする組織学では検出が困難です。少なくとも 24 時間。
3 人の乳房病理学者からなる専門委員会が画像を評価し、従来の免疫組織化学的染色と同等の品質と精度があると判断しました。 Ozcan 氏は、医薬品開発において仮想染色を商業化する可能性を見出していますが、組織学において有毒な染料や高価な染色装置の必要性をなくしたいと考えています。
セルの検索
セル画像からデータを抽出したい場合は、画像内のセルの実際の位置を知る必要があります。このプロセスはセルとも呼ばれます。セグメンテーション(細胞セグメンテーション)。
研究者は、顕微鏡で
細胞を観察するか、ソフトウェアで細胞の輪郭を 1 つずつ説明する必要があります。
カリフォルニア工科大学の計算生物学者であるモーガン シュワルツ氏は、処理を自動化する方法を模索しています。画像データセットがますます大きくなるにつれて、従来の手動による方法もボトルネックに直面しています。一部の実験 は自動化なしでは分析できません。
シュワルツ大学の大学院顧問である生物工学者のデビッド・ヴァン・ヴァレン氏は、一連の人工知能モデルを作成し、deepcell.org Web サイトで公開しました。これは、生きた細胞の計算と分析、保存に使用できます。組織画像内の細胞とその他の特徴。
Van Valen は、スタンフォード大学の癌生物学者 Noah Greenwald などの共同研究者とともに、 迅速に実行できる深層学習モデル Mesmer も開発しました。さまざまな組織タイプの細胞と核を正確に検出します。
Greenwald 氏によると、研究者はこの情報を使用して 癌性組織と非癌性組織を区別し、治療前後の違いを探したり、画像の変化に基づいて、一部の患者がなぜ治療を行うのかをよりよく理解できる可能性があります。患者は反応するか反応しないか、また腫瘍のサブタイプを決定します。
タンパク質の局在化
Human Protein Atlas プロジェクトは、深層学習のもう 1 つのアプリケーションである細胞内局在化を利用しています。スタンフォード大学の生物工学者エマ・ランドバーグ氏は、このプロジェクトにより過去数十年にわたり、人間の細胞や組織、タンパク質の発現の様子を描いた何百万枚もの画像が生成されてきたと述べた。
当初、プロジェクト参加者は これらの画像に手動で注釈を付ける必要がありました が、この方法は持続不可能であったため、Lundberg は人工知能アルゴリズムの助けを求め始めました。
過去数年、彼女は Kaggle チャレンジ でクラウドソーシング ソリューションを開始し始め、科学者や人工知能愛好家がさまざまなコンピューティング タスクを完了して賞金を獲得しました。 2 つのプロジェクトの賞金はそれぞれ 37,000 米ドル
と25,000 米ドルです。 出場者は教師あり機械学習モデルを設計し、タンパク質マップ画像に注釈を付けます。
Kaggle チャレンジで得られた結果もプロジェクト メンバーを驚かせました。優勝したモデルのパフォーマンスは、Lundberg の以前のタンパク質局在パターンのマルチラベル分類# # よりも約 20% 優れていました。 # 、細胞株に一般化することができ、細胞の複数の場所に存在するタンパク質を正確に分類するという新たな業界のブレークスルーも達成しました。
モデルが手元にあれば、生物学的実験を進めることができます。ヒトのタンパク質は同じタンパク質であるため、その位置は重要です。存在する場所が異なれば動作も異なり、タンパク質が核にあるかミトコンドリアにあるかを知ることは、その機能を理解するのに役立ちます。
動物の行動の追跡
スイスのエコール・ポリテクニック・フェデラーレ・ド・ローザンヌのキャンパス内にあるバイオテクノロジーセンターの神経科学者マッケンジー・マティスは、脳がどのように行動するかについて長い間興味を持ってきた。行動を推進します。
この目的を達成するために、彼女は DeepLabCut と呼ばれるプログラムを開発しました。これにより、神経科学者は
動物の姿勢や細かい動きをビデオから追跡し、「猫」のビデオなどを変換できるようになります。動物の記録はデータ化されます。
DeepLabcut は、研究者がボタンをクリックするだけでビデオをアップロードして注釈を付け、深層学習モデルをトレーニングできるグラフィカル ユーザー インターフェイスを提供します。 今年の 4 月、Mathis のチームは
複数の動物のポーズを同時に推定できるようにソフトウェアを拡張しました。これは人間と人工動物の両方にとって有益です。インテリジェンス 全く新しい挑戦です。
DeepLabCut によって訓練されたモデルをマーモセットに適用したところ、研究者らは、これらの動物が非常に近づくと、体が一直線に並び、同様の動物の方を向くことを発見しました。離れているときは、お互いに向かい合う傾向があります。 生物学者は、2 匹の動物がどのように相互作用し、世界を見つめ、観察するかを理解するために動物の姿勢を特定します。
以上が肉体労働から産業革命へ! Nature の記事: 深層学習によって革命を起こした生物学的画像解析の 5 つの分野の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

ホットAIツール

Undresser.AI Undress
リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover
写真から衣服を削除するオンライン AI ツール。

Undress AI Tool
脱衣画像を無料で

Clothoff.io
AI衣類リムーバー

AI Hentai Generator
AIヘンタイを無料で生成します。

人気の記事

ホットツール

メモ帳++7.3.1
使いやすく無料のコードエディター

SublimeText3 中国語版
中国語版、とても使いやすい

ゼンドスタジオ 13.0.1
強力な PHP 統合開発環境

ドリームウィーバー CS6
ビジュアル Web 開発ツール

SublimeText3 Mac版
神レベルのコード編集ソフト(SublimeText3)

ホットトピック

BERT は、2018 年に Google によって提案された事前トレーニング済みの深層学習言語モデルです。正式名は BidirectionEncoderRepresentationsfromTransformers で、Transformer アーキテクチャに基づいており、双方向エンコードの特性を備えています。従来の一方向コーディング モデルと比較して、BERT はテキストを処理するときにコンテキスト情報を同時に考慮できるため、自然言語処理タスクで優れたパフォーマンスを発揮します。その双方向性により、BERT は文内の意味関係をより深く理解できるようになり、それによってモデルの表現能力が向上します。事前トレーニングおよび微調整方法を通じて、BERT は感情分析、命名などのさまざまな自然言語処理タスクに使用できます。

以前に書きましたが、今日は、深層学習テクノロジーが複雑な環境におけるビジョンベースの SLAM (同時ローカリゼーションとマッピング) のパフォーマンスをどのように向上させることができるかについて説明します。ここでは、深部特徴抽出と深度マッチング手法を組み合わせることで、低照度条件、動的照明、テクスチャの弱い領域、激しいセックスなどの困難なシナリオでの適応を改善するように設計された多用途のハイブリッド ビジュアル SLAM システムを紹介します。当社のシステムは、拡張単眼、ステレオ、単眼慣性、ステレオ慣性構成を含む複数のモードをサポートしています。さらに、他の研究にインスピレーションを与えるために、ビジュアル SLAM と深層学習手法を組み合わせる方法も分析します。公開データセットと自己サンプリングデータに関する広範な実験を通じて、測位精度と追跡堅牢性の点で SL-SLAM の優位性を実証しました。

潜在空間埋め込み (LatentSpaceEmbedding) は、高次元データを低次元空間にマッピングするプロセスです。機械学習と深層学習の分野では、潜在空間埋め込みは通常、高次元の入力データを低次元のベクトル表現のセットにマッピングするニューラル ネットワーク モデルです。このベクトルのセットは、「潜在ベクトル」または「潜在ベクトル」と呼ばれることがよくあります。エンコーディング」。潜在空間埋め込みの目的は、データ内の重要な特徴をキャプチャし、それらをより簡潔でわかりやすい形式で表現することです。潜在空間埋め込みを通じて、低次元空間でデータの視覚化、分類、クラスタリングなどの操作を実行し、データをよりよく理解して活用できます。潜在空間埋め込みは、画像生成、特徴抽出、次元削減など、多くの分野で幅広い用途があります。潜在空間埋め込みがメイン

今日の急速な技術変化の波の中で、人工知能 (AI)、機械学習 (ML)、および深層学習 (DL) は輝かしい星のようなもので、情報技術の新しい波をリードしています。これら 3 つの単語は、さまざまな最先端の議論や実践で頻繁に登場しますが、この分野に慣れていない多くの探検家にとって、その具体的な意味や内部のつながりはまだ謎に包まれているかもしれません。そこで、まずはこの写真を見てみましょう。ディープラーニング、機械学習、人工知能の間には密接な相関関係があり、進歩的な関係があることがわかります。ディープラーニングは機械学習の特定の分野であり、機械学習

2006 年にディープ ラーニングの概念が提案されてから、ほぼ 20 年が経過しました。ディープ ラーニングは、人工知能分野における革命として、多くの影響力のあるアルゴリズムを生み出してきました。では、ディープラーニングのトップ 10 アルゴリズムは何だと思いますか?私の考えでは、ディープ ラーニングのトップ アルゴリズムは次のとおりで、いずれもイノベーション、アプリケーションの価値、影響力の点で重要な位置を占めています。 1. ディープ ニューラル ネットワーク (DNN) の背景: ディープ ニューラル ネットワーク (DNN) は、多層パーセプトロンとも呼ばれ、最も一般的なディープ ラーニング アルゴリズムです。最初に発明されたときは、コンピューティング能力のボトルネックのため疑問視されていました。最近まで長年にわたる計算能力、データの爆発的な増加によって画期的な進歩がもたらされました。 DNN は、複数の隠れ層を含むニューラル ネットワーク モデルです。このモデルでは、各層が入力を次の層に渡し、

畳み込みニューラル ネットワーク (CNN) と Transformer は、さまざまなタスクで優れたパフォーマンスを示した 2 つの異なる深層学習モデルです。 CNN は主に、画像分類、ターゲット検出、画像セグメンテーションなどのコンピューター ビジョン タスクに使用されます。畳み込み演算を通じて画像上の局所的な特徴を抽出し、プーリング演算を通じて特徴の次元削減と空間的不変性を実行します。対照的に、Transformer は主に、機械翻訳、テキスト分類、音声認識などの自然言語処理 (NLP) タスクに使用されます。セルフアテンション メカニズムを使用してシーケンス内の依存関係をモデル化し、従来のリカレント ニューラル ネットワークにおける逐次計算を回避します。これら 2 つのモデルは異なるタスクに使用されますが、シーケンス モデリングでは類似点があるため、

RMSprop は、ニューラル ネットワークの重みを更新するために広く使用されているオプティマイザーです。これは、2012 年に Geoffrey Hinton らによって提案され、Adam オプティマイザーの前身です。 RMSprop オプティマイザの登場は主に、勾配の消失や勾配の爆発など、SGD 勾配降下法アルゴリズムで発生するいくつかの問題を解決することを目的としています。 RMSprop オプティマイザーを使用すると、学習率を効果的に調整し、重みを適応的に更新できるため、深層学習モデルのトレーニング効果が向上します。 RMSprop オプティマイザの中心となるアイデアは、異なるタイム ステップでの勾配が重みの更新に異なる影響を与えるように、勾配の加重平均を実行することです。具体的には、RMSprop は各パラメータの 2 乗を計算します。

エディター | Radish Skin 2021 年の強力な AlphaFold2 のリリース以来、科学者はタンパク質構造予測モデルを使用して、細胞内のさまざまなタンパク質構造をマッピングし、薬剤を発見し、既知のあらゆるタンパク質相互作用の「宇宙地図」を描いてきました。ちょうど今、Google DeepMind が AlphaFold3 モデルをリリースしました。このモデルは、タンパク質、核酸、小分子、イオン、修飾残基を含む複合体の結合構造予測を実行できます。 AlphaFold3 の精度は、これまでの多くの専用ツール (タンパク質-リガンド相互作用、タンパク質-核酸相互作用、抗体-抗原予測) と比較して大幅に向上しました。これは、単一の統合された深層学習フレームワーク内で、次のことを達成できることを示しています。
