目錄
大腦活動解碼如何解讀?
影像檢索速度提升7倍
首頁 科技週邊 人工智慧 AI即時解讀大腦訊號,7倍速還原影像關鍵視覺特徵,LeCun轉發

AI即時解讀大腦訊號,7倍速還原影像關鍵視覺特徵,LeCun轉發

Oct 19, 2023 pm 02:13 PM
數據 數據集 meg

現在,AI已經可以即時解讀大腦訊號了!

這不是聳人聽聞,而是Meta的新研究,能夠憑腦訊號猜出你在0.5秒內看的圖,並用AI即時還原出來。

在此之前,AI雖然已經能從大腦訊號中比較準確地還原影像,但還有個bug-不夠快。

為此,Meta研發了一個新解碼模型,讓AI光是影像檢索的速度就提升了7倍,幾乎「瞬間」能讀出人在看什麼,並猜出個大概。

像是個站立的男人,AI幾次還原後,竟然真的解讀出了一個「站立的人」出來:

AI即時解讀大腦訊號,7倍速還原影像關鍵視覺特徵,LeCun轉發

LeCun轉發表示,從MEG腦訊號重建視覺等輸入的研究,確實很棒。

AI即時解讀大腦訊號,7倍速還原影像關鍵視覺特徵,LeCun轉發圖片

那麼,Meta究竟是怎麼讓AI「快速讀腦」的呢?

大腦活動解碼如何解讀?

目前,AI讀取大腦訊號並還原影像的方法,主要有兩種。

其中一種是fMRI(功能性磁振造影),可以產生流向大腦特定部位的血流影像;另一種是MEG(腦磁圖),可以測量腦內神經電流發出的極其微弱的生物磁場訊號。

然而,fMRI神經成像的速度往往非常慢,平均2秒才出一張圖(≈0.5 Hz),相較之下MEG甚至能在每秒內記錄上千次大腦活動影像( ≈5000 Hz)。

所以比起fMRI,為什麼不用MEG數據來試試還原出「人類看到的圖像」呢?

基於這個思路,作者們設計了一個MEG解碼模型,由三個部分組成。

第一部分預訓練模型,負責從圖像中獲得embeddings;

第二部分是一個端到端訓練模型,負責將MEG資料與圖像embeddings對齊;

第三部分是一個預訓練影像產生器,負責還原出最終的影像。

AI即時解讀大腦訊號,7倍速還原影像關鍵視覺特徵,LeCun轉發圖片

訓練上,研究人員用了一個名叫THINGS-MEG的資料集,包含了4個年輕人(2男2女,平均23.25歲)觀看影像時所記錄的MEG資料。

這些年輕人總共觀看了22448張圖像(1854種類型),每張圖像顯示時間為0.5秒,間隔時間為0.8~1.2秒,其中有200張圖片被反覆觀看。

除此之外,還有3659張圖像沒有展示給參與者,但也被用於圖像檢索中。

所以,這樣訓練出來的AI,效果究竟如何?

影像檢索速度提升7倍

整體來看,這項研究設計的MEG解碼模型,比線性解碼器的影像檢索速度提升了7倍。

其中,比較CLIP等模型,又以Meta研發的視覺Transformer架構DINOv2在擷取影像特徵方面表現較好,更能將MEG資料和影像embeddings對齊。

AI即時解讀大腦訊號,7倍速還原影像關鍵視覺特徵,LeCun轉發圖片

作者將整體產生的圖像分成了三大類,匹配度最高的、中等的和匹配度最差的:

AI即時解讀大腦訊號,7倍速還原影像關鍵視覺特徵,LeCun轉發圖片

不過,從生成範例來看,這個AI還原出來的圖片效果,確實不算太好。

即使是還原度最高的圖像,仍然受到了一些網友的質疑:為什麼熊貓看起來完全不像熊貓?

AI即時解讀大腦訊號,7倍速還原影像關鍵視覺特徵,LeCun轉發圖片

作者表示:至少像黑白熊。 (熊貓震怒!)

AI即時解讀大腦訊號,7倍速還原影像關鍵視覺特徵,LeCun轉發圖片

當然,研究人員也承認,MEG數據復原出來的圖像效果,確實目前還不太行,主要優勢還是在速度上。

例如先前來自明尼蘇達大學等機構的一項名為7T fMRI的研究,就能以較高的復原度從fMRI資料中還原出人眼看到的影像。

AI即時解讀大腦訊號,7倍速還原影像關鍵視覺特徵,LeCun轉發圖片

無論是人類的衝浪動作、飛機的形狀、斑馬的顏色、火車的背景,基於fMRI資料訓練的AI都能更好地將圖像還原出來:

AI即時解讀大腦訊號,7倍速還原影像關鍵視覺特徵,LeCun轉發圖片

對此,作者們也給了解釋,認為這是因為AI基於MEG還原出來的視覺特徵偏高級。

但相較之下,7T fMRI可以擷取並還原出影像中較低階的視覺特徵,這樣產生的影像整體還原度更高。

你覺得這類研究可以用在哪些地方?

論文網址:
https://www.php.cn/link/f40723ed94042ea9ea36bfb5ad4157b2

#

以上是AI即時解讀大腦訊號,7倍速還原影像關鍵視覺特徵,LeCun轉發的詳細內容。更多資訊請關注PHP中文網其他相關文章!

本網站聲明
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

Video Face Swap

Video Face Swap

使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱工具

記事本++7.3.1

記事本++7.3.1

好用且免費的程式碼編輯器

SublimeText3漢化版

SublimeText3漢化版

中文版,非常好用

禪工作室 13.0.1

禪工作室 13.0.1

強大的PHP整合開發環境

Dreamweaver CS6

Dreamweaver CS6

視覺化網頁開發工具

SublimeText3 Mac版

SublimeText3 Mac版

神級程式碼編輯軟體(SublimeText3)

使用ddrescue在Linux上恢復數據 使用ddrescue在Linux上恢復數據 Mar 20, 2024 pm 01:37 PM

DDREASE是一種用於從檔案或區塊裝置(如硬碟、SSD、RAM磁碟、CD、DVD和USB儲存裝置)復原資料的工具。它將資料從一個區塊設備複製到另一個區塊設備,留下損壞的資料區塊,只移動好的資料區塊。 ddreasue是一種強大的恢復工具,完全自動化,因為它在恢復操作期間不需要任何干擾。此外,由於有了ddasue地圖文件,它可以隨時停止和恢復。 DDREASE的其他主要功能如下:它不會覆寫恢復的數據,但會在迭代恢復的情況下填補空白。但是,如果指示工具明確執行此操作,則可以將其截斷。將資料從多個檔案或區塊還原到單

開源!超越ZoeDepth! DepthFM:快速且精確的單目深度估計! 開源!超越ZoeDepth! DepthFM:快速且精確的單目深度估計! Apr 03, 2024 pm 12:04 PM

0.這篇文章乾了啥?提出了DepthFM:一個多功能且快速的最先進的生成式單目深度估計模型。除了傳統的深度估計任務外,DepthFM還展示了在深度修復等下游任務中的最先進能力。 DepthFM效率高,可以在少數推理步驟內合成深度圖。以下一起來閱讀這項工作~1.論文資訊標題:DepthFM:FastMonocularDepthEstimationwithFlowMatching作者:MingGui,JohannesS.Fischer,UlrichPrestel,PingchuanMa,Dmytr

如何多條件使用Excel過濾功能 如何多條件使用Excel過濾功能 Feb 26, 2024 am 10:19 AM

如果您需要了解如何在Excel中使用具有多個條件的篩選功能,以下教學將引導您完成對應步驟,確保您可以有效地篩選資料和排序資料。 Excel的篩選功能是非常強大的,能夠幫助您從大量資料中提取所需的資訊。這個功能可以根據您設定的條件,過濾資料並只顯示符合條件的部分,讓資料的管理變得更有效率。透過使用篩選功能,您可以快速找到目標數據,節省了尋找和整理數據的時間。這個功能不僅可以應用在簡單的資料清單上,還可以根據多個條件進行篩選,幫助您更精準地定位所需資訊。總的來說,Excel的篩選功能是一個非常實用的

Google狂喜:JAX性能超越Pytorch、TensorFlow!或成GPU推理訓練最快選擇 Google狂喜:JAX性能超越Pytorch、TensorFlow!或成GPU推理訓練最快選擇 Apr 01, 2024 pm 07:46 PM

谷歌力推的JAX在最近的基準測試中表現已經超過Pytorch和TensorFlow,7項指標排名第一。而且測試並不是JAX性能表現最好的TPU上完成的。雖然現在在開發者中,Pytorch依然比Tensorflow更受歡迎。但未來,也許有更多的大型模型會基於JAX平台進行訓練和運行。模型最近,Keras團隊為三個後端(TensorFlow、JAX、PyTorch)與原生PyTorch實作以及搭配TensorFlow的Keras2進行了基準測試。首先,他們為生成式和非生成式人工智慧任務選擇了一組主流

iPhone上的蜂窩數據網路速度慢:修復 iPhone上的蜂窩數據網路速度慢:修復 May 03, 2024 pm 09:01 PM

在iPhone上面臨滯後,緩慢的行動數據連線?通常,手機上蜂窩互聯網的強度取決於幾個因素,例如區域、蜂窩網絡類型、漫遊類型等。您可以採取一些措施來獲得更快、更可靠的蜂窩網路連線。修復1–強制重啟iPhone有時,強制重啟設備只會重置許多內容,包括蜂窩網路連線。步驟1–只需按一次音量調高鍵並放開即可。接下來,按降低音量鍵並再次釋放它。步驟2–過程的下一部分是按住右側的按鈕。讓iPhone完成重啟。啟用蜂窩數據並檢查網路速度。再次檢查修復2–更改資料模式雖然5G提供了更好的網路速度,但在訊號較弱

特斯拉機器人進廠打工,馬斯克:手的自由度今年將達到22個! 特斯拉機器人進廠打工,馬斯克:手的自由度今年將達到22個! May 06, 2024 pm 04:13 PM

特斯拉機器人Optimus最新影片出爐,已經可以在工廠裡打工了。正常速度下,它分揀電池(特斯拉的4680電池)是這樣的:官方還放出了20倍速下的樣子——在小小的「工位」上,揀啊揀啊揀:這次放出的影片亮點之一在於Optimus在廠子裡完成這項工作,是完全自主的,全程沒有人為的干預。而且在Optimus的視角之下,它還可以把放歪了的電池重新撿起來放置,主打一個自動糾錯:對於Optimus的手,英偉達科學家JimFan給出了高度的評價:Optimus的手是全球五指機器人裡最靈巧的之一。它的手不僅有觸覺

超級智能體生命力覺醒!可自我更新的AI來了,媽媽再也不用擔心資料瓶頸難題 超級智能體生命力覺醒!可自我更新的AI來了,媽媽再也不用擔心資料瓶頸難題 Apr 29, 2024 pm 06:55 PM

哭死啊,全球狂煉大模型,一網路的資料不夠用,根本不夠用。訓練模型搞得跟《飢餓遊戲》似的,全球AI研究者,都在苦惱怎麼才能餵飽這群資料大胃王。尤其在多模態任務中,這問題尤其突出。一籌莫展之際,來自人大系的初創團隊,用自家的新模型,率先在國內把「模型生成數據自己餵自己」變成了現實。而且還是理解側和生成側雙管齊下,兩側都能產生高品質、多模態的新數據,對模型本身進行數據反哺。模型是啥?中關村論壇上剛露面的多模態大模型Awaker1.0。團隊是誰?智子引擎。由人大高瓴人工智慧學院博士生高一鑷創立,高

阿里7B多模態文件理解大模型拿下新SOTA 阿里7B多模態文件理解大模型拿下新SOTA Apr 02, 2024 am 11:31 AM

多模態文件理解能力新SOTA!阿里mPLUG團隊發布最新開源工作mPLUG-DocOwl1.5,針對高解析度圖片文字辨識、通用文件結構理解、指令遵循、外部知識引入四大挑戰,提出了一系列解決方案。話不多說,先來看效果。複雜結構的圖表一鍵識別轉換為Markdown格式:不同樣式的圖表都可以:更細節的文字識別和定位也能輕鬆搞定:還能對文檔理解給出詳細解釋:要知道,“文檔理解”目前是大語言模型實現落地的一個重要場景,市面上有許多輔助文檔閱讀的產品,有的主要透過OCR系統進行文字識別,配合LLM進行文字理

See all articles