AI読書脳が爆発！脳画像をスキャンし、安定拡散により画像をリアルに再現-AI-php.cn

ホームページ

テクノロジー周辺機器

AI読書脳が爆発！脳画像をスキャンし、安定拡散により画像をリアルに再現

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

Apr 12, 2023 pm 03:52 PM

ai 画像脳の写真

ホグワーツの魔法がなくても、他の人が何を考えているかを見ることができます。

手法は非常にシンプルで、安定拡散に基づいて脳画像を可視化します。

たとえば、あなたが目にするクマ、飛行機、電車はこんな感じです。

AI読書脳が爆発！脳画像をスキャンし、安定拡散により画像をリアルに再現

AI が脳信号を認識すると、生成される画像は次のとおりです。ポイントも含まれております。

AI読書脳が爆発！脳画像をスキャンし、安定拡散により画像をリアルに再現

この AI 脳読み取りテクノロジーは、CVPR 2023 に承認されたばかりで、ファンに瞬時の「頭蓋内オーガズム」を与えます。

AI読書脳が爆発！脳画像をスキャンし、安定拡散により画像をリアルに再現

#ワイルドすぎる！プロジェクトを促すことは忘れて、頭を使ってそれらの写真について「考える」だけで済みます。

AI読書脳が爆発！脳画像をスキャンし、安定拡散により画像をリアルに再現

安定拡散を使用して fMRI データから視覚画像を再構成することを想像してください。これは、非侵襲的技術の開発を意味するかもしれません。将来のブレインコンピューターインターフェース。

AI に人間の言語を直接スキップさせ、人間の脳で考えていることを認識させます。

AI読書脳が爆発！脳画像をスキャンし、安定拡散により画像をリアルに再現

# その頃には、マスク氏が開発した Neuralink もこの AI の上限に追いつくことになるでしょう。

微調整不要、AI で思考をダイレクトに再現

では、AI はどのようにして脳の読み取りを実現しているのでしょうか?

最新の研究は、日本の大阪大学の研究チームによるものです。

AI読書脳が爆発！脳画像をスキャンし、安定拡散により画像をリアルに再現

紙のアドレス: https://www.php.cn/link/0424d20160a6a558e5bf86a7bc9b67f0

大阪大学大学院生命機能研究科とNICTのCiNetの研究者らは、潜在拡散モデル(LDM)、より具体的には安定拡散を介して、fMRIデータから視覚体験を再構築しました。

全体の操作プロセスのフレームワークも非常にシンプルです: 1 つの画像エンコーダー、1 つの画像デコーダー、および 1 つのセマンティックデコーダー。

AI読書脳が爆発！脳画像をスキャンし、安定拡散により画像をリアルに再現

# これにより、チームは複雑な AI モデルをトレーニングして微調整する必要がなくなりました。

トレーニングする必要があるのは、下部視覚脳領域と上部視覚脳領域からの fMRI 信号を単一の安定拡散コンポーネントにマッピングする単純な線形モデルだけです。

具体的には、研究者らは脳領域を画像およびテキストエンコーダーへの入力としてマッピングしました。下位脳領域は画像エンコーダにマッピングされ、上位脳領域はテキストエンコーダにマッピングされます。これにより、システムは再構成に画像構成と意味論的なコンテンツを使用できるようになります。

最初はデコード分析です。研究で使用された LDM モデルは、画像エンコーダー ε、画像デコーダー D、およびテキストエンコーダー τ で構成されます。

研究者らは、それぞれ初期視覚野と高レベル視覚野の fMRI 信号から再構成画像 z の潜在表現と関連テキスト c を解読し、それらを入力として使用して、オートエンコーダ。

AI読書脳が爆発！脳画像をスキャンし、安定拡散により画像をリアルに再現

研究者らは、LDM のさまざまなコンポーネントからの fMRI 信号を予測するためのコーディングモデルを確立しました。 LDMの仕組み。

AI読書脳が爆発！脳画像をスキャンし、安定拡散により画像をリアルに再現

研究者らは、自然風景データセット (NSD) の fMRI 画像を使用して実験を行い、安定した拡散が可能かどうかをテストしました。被験者が見たものを再構成します。

符号化モデルと LDM に関連する潜像の予測精度は、最後のモデルが脳の後部の視覚野で最も高い予測精度を生み出すことがわかります。。

AI読書脳が爆発！脳画像をスキャンし、安定拡散により画像をリアルに再現

被験者の視覚的再構成の結果は、z のみを使用して再構成された画像が元の画像と視覚的に一致していることを示しています。ただし、意味的な内容をキャプチャすることはできません。

c のみを使用して再構成された画像は意味的忠実度が高くなりますが、視覚的な一貫性が劣りますが、zc を使用して再構成された画像は意味的忠実度が高く、視覚的な一貫性が低い可能性があります。

AI読書脳が爆発！脳画像をスキャンし、安定拡散により画像をリアルに再現

#同じ画像上のすべての被写体からの再構成結果は、再構成の効果が被写体ごとに異なることを示しています。安定しています。比較的正確です。

特定の詳細の違いは、再構成プロセスのエラーではなく、個人の知覚経験やデータ品質の違いに起因する可能性があります。

AI読書脳が爆発！脳画像をスキャンし、安定拡散により画像をリアルに再現

#最後に、定量的評価の結果をグラフ化しました。

さまざまな結果は、研究で使用された方法が低レベルの視覚的外観をキャプチャできるだけでなく、元の刺激の高レベルの意味内容もキャプチャできることを示しています。

AI読書脳が爆発！脳画像をスキャンし、安定拡散により画像をリアルに再現

#この観点から、実験は画像とテキストのデコードを組み合わせることで正確な再構成が可能であることを示しています。

被験者間で精度には差があったが、これらの違いはfMRI画像の品質に関係していた、と研究者らは述べた。チームによると、再構成の品質は現在のSOTA手法と同等ですが、そこで使用されるAIモデルのトレーニングは必要ありません。

同時に、チームは fMRI データから派生したモデルを使用して、逆拡散プロセス中にセマンティックコンテンツがどのように生成されるかなど、安定拡散のさまざまな構成要素を研究しました。 U-Net でどのようなプロセスが行われるか。

ノイズ除去プロセスの初期段階では、U-Net のボトルネックレイヤー (オレンジ) が最高の予測パフォーマンスを生み出し、ノイズ除去プロセスが進むにつれて、初期レイヤー (青) が予測用に生成されます。初期の視覚野の活動のボトルネック層は、より高いレベルの視覚野に移行します。

これは、拡散プロセスの開始時に画像情報がボトルネック層で圧縮され、ノイズ除去により視覚野に U-Net 層間の分離が現れることを意味します。

AI読書脳が爆発！脳画像をスキャンし、安定拡散により画像をリアルに再現

# さらに、チームは普及のさまざまな段階での画像変換の定量的な説明を開発中です。このようにして、研究者らは、広く使用されているものの理解がまだ限られている拡散モデルを生物学的な観点からより深く理解することに貢献することを目指しています。

人間の脳画像はAIによって解読されたのでしょうか?

研究者たちは長年にわたり、人工知能モデルを使用して人間の脳からの情報を解読してきました。

ほとんどの手法の中核では、事前に記録された fMRI 画像がテキストまたは画像の生成 AI モデルへの入力として使用されます。

たとえば、2018 年の初めに、日本の研究者チームは、ニューラルネットワークが fMRI 記録から画像を再構成する方法を示しました。

2019年、グループはサルのニューロンから画像を再構成し、ジャン・レミ・キング率いるメタの研究グループはテキストを取得するためのfMRIデータなどの新しい研究を発表した。

AI読書脳が爆発！脳画像をスキャンし、安定拡散により画像をリアルに再現

2022 年 10 月、テキサス大学オースティン校のチームは、GPT モデルが fMRI からデータを生成できることを示しました。スキャンビデオ内で見られる意味論的なコンテンツを説明するテキストが推測されます。

2022 年 11 月、シンガポール国立大学、香港中文大学、スタンフォード大学の研究者は、MinD-Vis 拡散モデルを使用して、fMRI スキャンからの画像を大幅に再構成しました。当時利用可能な方法よりも正確です。

AI読書脳が爆発！脳画像をスキャンし、安定拡散により画像をリアルに再現

さらに遡ると、一部のネチズンは「脳波に基づいた画像の生成は少なくとも 2008 年から存在していた」と指摘しました。はい、安定拡散が何らかの方法で人々の心を読み取ることができるとほのめかすのはまったくばかげています。」

カリフォルニア大学バークレー校が Nature に掲載したこの論文では、次のように述べられています。脳波活動は、ビジュアルデコーダを使用して画像に変換できます。

AI読書脳が爆発！脳画像をスキャンし、安定拡散により画像をリアルに再現

# 歴史をたどるとなると、まだ人がいます彼は、大脳皮質からの画像の再構成に関するスタンフォード大学リー・フェイフェイによる 1999 年の研究を直接取り出しました。＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃リー・フェイフェイさんもこの投稿にコメントして転送し、当時はまだ大学のインターンだったと述べた。

AI読書脳が爆発！脳画像をスキャンし、安定拡散により画像をリアルに再現

同じく 2011 年、カリフォルニア大学バークレー校の研究では、機能的磁気共鳴画像法 (fMRI) と計算モデルを使用して予備的な再構成を行いました。脳の「動的視覚イメージ」。

AI読書脳が爆発！脳画像をスキャンし、安定拡散により画像をリアルに再現

言い換えれば、人々が見たクリップを再作成したのです。

しかし、最新の研究と比較すると、この再構成はまったく「高精細」とは言えず、ほとんど認識できません。＃＃＃＃＃＃＃＃＃著者について＃＃＃

高木裕

高木裕は、大阪大学の助教授です。彼の研究対象は、計算神経科学と人工知能の交差点にあります。

博士課程では、ATR 脳情報通信研究室で機能的磁気共鳴画像法 (fMRI) を使用して脳全体の機能的接続から個人差を予測する技術を研究しました。

最近では、オックスフォード大学の人間の脳活動に関するオックスフォードセンターと、オックスフォード大学の心理学部で、機械学習技術を使用して、複雑な意思決定タスクにおける動的計算を理解しています。東京大学。

AI読書脳が爆発！脳画像をスキャンし、安定拡散により画像をリアルに再現

#西本真司

西本真司は大阪大学教授。彼の研究は、脳内の視覚および認知処理の定量的な理解に焦点を当てています。

AI読書脳が爆発！脳画像をスキャンし、安定拡散により画像をリアルに再現

より具体的には、西本教授のチームの研究の焦点は、自然な知覚および認知条件下で誘発される脳活動の予測モデルを構築することです。そして表現。

AI読書脳が爆発！脳画像をスキャンし、安定拡散により画像をリアルに再現

一部のネチズンは、この研究が夢の解釈に使用できるかどうかを著者に尋ねました。

「同じ技術を睡眠中の脳活動に適用することは可能ですが、そのような適用の精度は不明です。」

AI読書脳が爆発！脳画像をスキャンし、安定拡散により画像をリアルに再現

この研究を読んだ後: 合法性は完全に確立されています。

参考:

https: / /www.php.cn/link/0424d20160a6a558e5bf86a7bc9b67f0

https://www.php.cn/link/ 02d72b702eed900577b953ef7a9c1182

以上がAI読書脳が爆発！脳画像をスキャンし、安定拡散により画像をリアルに再現の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

このウェブサイトの声明

この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

ホットAIツール

Video Face Swap

完全無料の AI 顔交換ツールを使用して、あらゆるビデオの顔を簡単に交換できます。

ホットツール

ホットトピック

Java チュートリアル

1663

CakePHP チュートリアル

1420

Laravel チュートリアル

1313

PHP チュートリアル

1266

C# チュートリアル

1239

Related knowledge

2025年のトップ10の通貨取引プラットフォームのどれがトップ10の通貨取引プラットフォームの1つです Apr 28, 2025 pm 08:12 PM

2025年の世界の上位10の暗号通貨取引所には、Binance、Okx、Gate.io、Coinbase、Kraken、Huobi、Bitfinex、Kucoin、Bittrex、Poloniexが含まれます。これらはすべて、高い取引量とセキュリティで知られています。

ビットコインの価値はいくらですか Apr 28, 2025 pm 07:42 PM

ビットコインの価格は20,000ドルから30,000ドルの範囲です。 1。ビットコインの価格は2009年以来劇的に変動し、2017年には20,000ドル近くに達し、2021年にはほぼ60,000ドルに達しました。2。価格は、市場需要、供給、マクロ経済環境などの要因の影響を受けます。 3.取引所、モバイルアプリ、ウェブサイトを通じてリアルタイム価格を取得します。 4。ビットコインの価格は非常に不安定であり、市場の感情と外部要因によって駆動されます。 5.従来の金融市場と特定の関係を持ち、世界の株式市場、米ドルの強さなどの影響を受けています。6。長期的な傾向は強気ですが、リスクを慎重に評価する必要があります。

世界のトップ10の通貨取引プラットフォームのどれがトップ10の通貨取引プラットフォームの最新バージョンです Apr 28, 2025 pm 08:09 PM

世界の上位10の暗号通貨取引プラットフォームには、Binance、Okx、Gate.io、Coinbase、Kraken、Huobi Global、Bitfinex、Bittrex、Kucoin、Poloniexが含まれます。これらはすべて、さまざまな取引方法と強力なセキュリティ対策を提供します。

復号化GATE.IO戦略のアップグレード：Memebox 2.0でCrypto Asset Managementを再定義する方法は？ Apr 28, 2025 pm 03:33 PM

Memebox 2.0は、革新的なアーキテクチャとパフォーマンスのブレークスルーを通じて、暗号資産管理を再定義します。 1）3つの主要な問題点を解決します。資産サイロ、収入の減少、セキュリティと利便性のパラドックスです。 2）インテリジェントアセットハブ、動的リスク管理およびリターンエンハンスメントエンジン、クロスチェーン移動速度、平均降伏率、およびセキュリティインシデント応答速度が向上します。 3）ユーザーに、ユーザー価値の再構築を実現し、資産の視覚化、ポリシーの自動化、ガバナンス統合を提供します。 4）生態学的なコラボレーションとコンプライアンスの革新により、プラットフォームの全体的な有効性が向上しました。 5）将来的には、スマート契約保険プール、予測市場統合、AI主導の資産配分が開始され、引き続き業界の発展をリードします。

トップ通貨取引プラットフォームは何ですか？トップ10の最新の仮想通貨交換 Apr 28, 2025 pm 08:06 PM

現在、上位10の仮想通貨交換にランクされています。1。Binance、2。Okx、3。Gate.io、4。CoinLibrary、5。Siren、6。HuobiGlobal Station、7。Bybit、8。Kucoin、9。Bitcoin、10。BitStamp。

トップ10の仮想通貨取引アプリは何ですか？最新のデジタル通貨交換ランキング Apr 28, 2025 pm 08:03 PM

Binance、OKX、Gate.ioなどの上位10のデジタル通貨交換は、システムを改善し、効率的な多様化したトランザクション、厳格なセキュリティ対策を改善しました。

CでChronoライブラリを使用する方法は？ Apr 28, 2025 pm 10:18 PM

CでChronoライブラリを使用すると、時間と時間の間隔をより正確に制御できます。このライブラリの魅力を探りましょう。 CのChronoライブラリは、時間と時間の間隔に対処するための最新の方法を提供する標準ライブラリの一部です。 Time.HとCtimeに苦しんでいるプログラマーにとって、Chronoは間違いなく恩恵です。コードの読みやすさと保守性を向上させるだけでなく、より高い精度と柔軟性も提供します。基本から始めましょう。 Chronoライブラリには、主に次の重要なコンポーネントが含まれています。STD:: Chrono :: System_Clock：現在の時間を取得するために使用されるシステムクロックを表します。 STD :: Chron

CでハイDPIディスプレイを処理する方法は？ Apr 28, 2025 pm 09:57 PM

CでのハイDPIディスプレイの取り扱いは、次の手順で達成できます。1）DPIを理解してスケーリングし、オペレーティングシステムAPIを使用してDPI情報を取得し、グラフィックスの出力を調整します。 2）クロスプラットフォームの互換性を処理し、SDLやQTなどのクロスプラットフォームグラフィックライブラリを使用します。 3）パフォーマンスの最適化を実行し、キャッシュ、ハードウェアアクセラレーション、および詳細レベルの動的調整によりパフォーマンスを改善します。 4）ぼやけたテキストやインターフェイス要素などの一般的な問題を解決し、DPIスケーリングを正しく適用することで解決します。

See all articles

AI読書脳が爆発！脳画像をスキャンし、安定拡散により画像をリアルに再現

ホットAIツール

Undresser.AI Undress

AI Clothes Remover

Undress AI Tool

Clothoff.io

Video Face Swap

人気の記事

ホットツール

メモ帳++7.3.1

SublimeText3 中国語版

ゼンドスタジオ 13.0.1

ドリームウィーバー CS6

SublimeText3 Mac版

ホットトピック