社群

學習

工具庫

AI工具

休閒

繁体中文

目錄

規模越大效果越好

首頁

科技週邊

人工智慧

世界模型大放異彩！這20多種自動駕駛場景數據的逼真程度令人難以置信...

世界模型大放異彩！這20多種自動駕駛場景數據的逼真程度令人難以置信...

Oct 09, 2023 pm 03:01 PM

模型自動駕駛

你認為這是一個普通無趣的自動駕駛影片嗎？

世界模型大放異彩！這20多種自動駕駛場景數據的逼真程度令人難以置信...

這段內容不需要改變原意，需要將其改寫為中文

沒有一幀是「真的」。

世界模型大放異彩！這20多種自動駕駛場景數據的逼真程度令人難以置信...

不同路況、各種天氣，20多種情境都能模擬，效果以假亂真。

世界模型大放異彩！這20多種自動駕駛場景數據的逼真程度令人難以置信...

世界模型再次展現出其強大的作用！這次，LeCun看到後都激動地轉發了

世界模型大放異彩！這20多種自動駕駛場景數據的逼真程度令人難以置信...

如上效果，由GAIA-1的最新版本帶來。

它規模達90億參數，用4700小時駕駛影片訓練，實現了輸入影片、文字或操作生成自動駕駛影片的效果。

帶來的最直接好處就是，更能預測未來事件。它可以模擬超過20種場景，從而進一步提高自動駕駛的安全性，並降低成本

世界模型大放異彩！這20多種自動駕駛場景數據的逼真程度令人難以置信...

#主創團隊表示，這將改變自動駕駛的遊戲規則！

GAIA-1是如何實現的？其實之前我們已經在自動駕駛的Daily中詳細介紹了Wayve團隊開發的GAIA-1：一種用於自動駕駛的生成式世界模型。如果你對此有興趣，可以去我們的公眾號閱讀相關內容！

規模越大效果越好

GAIA-1是一個多模態生成式世界模型，它能夠透過整合視覺、聽覺和語言等多種感知方式來理解和生成世界的表達。這個模型透過深度學習演算法，能夠從大量的資料中學習並推理出世界的結構和規律。 GAIA-1的目標是模擬人類的感知和認知能力，以便更好地理解和互動世界。它在許多領域都有廣泛的應用，包括自動駕駛、機器人技術和虛擬實境等。透過不斷地訓練和優化，GAIA-1將不斷進化和提升，成為一個更加智能和全面的世界模型

它使用視頻、文本和動作作為輸入，並生成逼真的駕駛場景視頻，同時可以對自動駕駛車輛的行為和場景特徵進行精細控制

而且可以僅透過文字提示來產生影片。

世界模型大放異彩！這20多種自動駕駛場景數據的逼真程度令人難以置信...

其模型原理類似於大型語言模型的原理，即預測下一個令牌

模型可以利用向量量化表示將視訊幀離散，然後預測未來場景，就轉換成了預測序列中的下一個token。然後再利用擴散模型從世界模型的語言空間產生高品質視訊。

具體步驟如下：

世界模型大放異彩！這20多種自動駕駛場景數據的逼真程度令人難以置信...

第一步簡單理解，就是對各種輸入進行重新編碼與排列組合。

透過使用專門的編碼器對各種輸入進行編碼，可以將不同的輸入投射到共享表示中。文字和視訊編碼器將輸入分離、嵌入，而操作表示則被單獨投射到共享表示中

這些編碼的表示具有時間的一致性

在進行排列之後，關鍵部分世界模型登場。

作為一個自回歸Transformer，它有能力預測序列中的下一組影像令牌。它不僅考慮了先前的圖像令牌，還要同時考慮文字和操作的上下文資訊

模型生成的內容不僅保持了圖像的一致性，還能與預測的文字和動作保持一致

團隊介紹，GAIA-1中的世界模型規模為65億參數，在64塊A100上訓練15天而成。

透過使用視訊解碼器和視訊擴散模型，最後將這些令牌轉換回視訊

這一步關乎視訊的語義品質、圖像準確性和時間一致性。

GAIA-1的視訊解碼器規模達26億參數規模，利用32台A100訓練15天而來。

值得一提的是，GAIA-1不僅和大語言模型原理相似，同時也呈現出了隨著模型規模擴大、產生品質提升的特點。

世界模型大放異彩！這20多種自動駕駛場景數據的逼真程度令人難以置信...

團隊對先前的6月份發布的早期版本和最新效果進行了對比

後者規模為前者的480倍。

可以直觀看影片在細節、解析度等方面都有明顯提升。

世界模型大放異彩！這20多種自動駕駛場景數據的逼真程度令人難以置信...

而從實際應用方面出發，GAIA-1也帶來了影響，其主創團隊表示，這會改變自動駕駛的規則。

世界模型大放異彩！這20多種自動駕駛場景數據的逼真程度令人難以置信...

原因來自三個面向：

安全
綜合訓練資料

首先安全方面，世界模型能夠透過模擬未來，讓AI有能力意識到自己的決定，這對自動駕駛的安全性來說很關鍵。

其次，訓練資料對自動駕駛來說也非常關鍵。產生的資料更安全、便宜，而且還能無限擴充。

生成式AI能夠解決自動駕駛面臨的一個主要挑戰－長尾場景。它可以處理更多邊緣情況，例如在大霧天氣中遇到橫穿馬路的行人。這將進一步提高自動駕駛的性能

Wayve是誰？

GAIA-1來自英國自動駕駛新創公司

Wayve。

Wayve成立於2017年，投資方有

微軟等，估值已經達到了獨角獸。

創辦人為現任執行長亞歷克斯·肯德爾和艾瑪爾·沙（公司官網領導層頁已無其資訊），兩人均畢業於劍橋大學，擁有機器學習博士學位

世界模型大放異彩！這20多種自動駕駛場景數據的逼真程度令人難以置信...

技術路線上，和特斯拉一樣，Wayve主張利用攝影機的純視覺方案，很早就拋棄高精地圖，堅定的走「即時感知」路線。

前不久，團隊發布的另一個大模型

LINGO-1也引發轟動。

這個自動駕駛模型在行車過程中能夠即時生成解說，從而進一步提高了模型的可解釋性

今年3月，比爾·蓋茨還曾試乘過Wayve的自動駕駛汽車。

世界模型大放異彩！這20多種自動駕駛場景數據的逼真程度令人難以置信...

#論文網址：https://arxiv.org/abs/2309.17080

世界模型大放異彩！這20多種自動駕駛場景數據的逼真程度令人難以置信...

需要被改寫的內容是：原文連結：https://mp.weixin.qq.com/s/bwTDovx9-UArk5lx5pZPag

以上是世界模型大放異彩！這20多種自動駕駛場景數據的逼真程度令人難以置信...的詳細內容。更多資訊請關注PHP中文網其他相關文章！

本網站聲明

本文內容由網友自願投稿，版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容，請聯絡admin@php.cn

熱門文章

R.E.P.O.能量晶體解釋及其做什麼（黃色晶體）

2 週前 By 尊渡假赌尊渡假赌尊渡假赌

倉庫：如何復興隊友

4 週前 By 尊渡假赌尊渡假赌尊渡假赌

Hello Kitty Island冒險：如何獲得巨型種子

3 週前 By 尊渡假赌尊渡假赌尊渡假赌

擊敗分裂小說需要多長時間？

3 週前 By DDD

R.E.P.O.保存文件位置：在哪里以及如何保護它？

3 週前 By DDD

顯示更多

熱門工具標籤

代碼&IT

音訊

商業

行銷

AI檢測器

聊天機器人

設計與藝術

熱門文章

R.E.P.O.能量晶體解釋及其做什麼（黃色晶體）

2 週前 By 尊渡假赌尊渡假赌尊渡假赌

倉庫：如何復興隊友

4 週前 By 尊渡假赌尊渡假赌尊渡假赌

Hello Kitty Island冒險：如何獲得巨型種子

3 週前 By 尊渡假赌尊渡假赌尊渡假赌

擊敗分裂小說需要多長時間？

3 週前 By DDD

R.E.P.O.保存文件位置：在哪里以及如何保護它？

3 週前 By DDD

顯示更多

熱門文章標籤

記事本++7.3.1

記事本++7.3.1

好用且免費的程式碼編輯器

SublimeText3漢化版

SublimeText3漢化版

中文版，非常好用

禪工作室 13.0.1

禪工作室 13.0.1

強大的PHP整合開發環境

Dreamweaver CS6

Dreamweaver CS6

視覺化網頁開發工具

SublimeText3 Mac版

SublimeText3 Mac版

神級程式碼編輯軟體(SublimeText3)

顯示更多

熱門話題

gmail信箱登陸入口在哪裡

7313

9

Java教學

1625

14

CakePHP 教程

1348

46

Laravel 教程

1260

25

PHP教程

1207

29

顯示更多

Related knowledge

自動駕駛場景中的長尾問題怎麼解決？

自動駕駛場景中的長尾問題怎麼解決？ Jun 02, 2024 pm 02:44 PM

自動駕駛場景中的長尾問題怎麼解決？

全球最強開源 MoE 模型來了，中文能力比肩 GPT-4，價格僅 GPT-4-Turbo 的近百分之一

全球最強開源 MoE 模型來了，中文能力比肩 GPT-4，價格僅 GPT-4-Turbo 的近百分之一 May 07, 2024 pm 04:13 PM

全球最強開源 MoE 模型來了，中文能力比肩 GPT-4，價格僅 GPT-4-Turbo 的近百分之一

替代MLP的KAN，被開源專案擴展到卷積了

替代MLP的KAN，被開源專案擴展到卷積了 Jun 01, 2024 pm 10:03 PM

替代MLP的KAN，被開源專案擴展到卷積了

你好，電動Atlas！波士頓動力機器人復活，180度詭異動作嚇到馬斯克

你好，電動Atlas！波士頓動力機器人復活，180度詭異動作嚇到馬斯克 Apr 18, 2024 pm 07:58 PM

你好，電動Atlas！波士頓動力機器人復活，180度詭異動作嚇到馬斯克

Google狂喜：JAX性能超越Pytorch、TensorFlow！或成GPU推理訓練最快選擇

Google狂喜：JAX性能超越Pytorch、TensorFlow！或成GPU推理訓練最快選擇 Apr 01, 2024 pm 07:46 PM

Google狂喜：JAX性能超越Pytorch、TensorFlow！或成GPU推理訓練最快選擇

AI顛覆數學研究！菲爾茲獎得主、華裔數學家領銜11篇頂刊論文｜陶哲軒轉贊

AI顛覆數學研究！菲爾茲獎得主、華裔數學家領銜11篇頂刊論文｜陶哲軒轉贊 Apr 09, 2024 am 11:52 AM

AI顛覆數學研究！菲爾茲獎得主、華裔數學家領銜11篇頂刊論文｜陶哲軒轉贊

nuScenes最新SOTA | SparseAD：稀疏查詢協助高效端對端自動駕駛！

nuScenes最新SOTA | SparseAD：稀疏查詢協助高效端對端自動駕駛！ Apr 17, 2024 pm 06:22 PM

nuScenes最新SOTA | SparseAD：稀疏查詢協助高效端對端自動駕駛！

聊聊端到端與下一代自動駕駛系統，以及端到端自動駕駛的一些迷思？

聊聊端到端與下一代自動駕駛系統，以及端到端自動駕駛的一些迷思？ Apr 15, 2024 pm 04:13 PM

聊聊端到端與下一代自動駕駛系統，以及端到端自動駕駛的一些迷思？

See all articles