索尼AI擊敗頂級真人賽車手,以1.5秒優勢打敗人類
「這是什麼情況?」艾蜜莉瓊斯(Emily Jones)不敢相信自己竟然落後了。
艾米麗瓊斯是一名多次奪冠的頂級GT 遊戲賽車手,她拍打著她的電競專用方向盤,眼睛盯著面前的螢幕:「我盡力了,但還是追不上它——它是怎麼做到的?」
在遊戲GT(Gran Turismo)中,瓊斯以每小時120 英里的速度駕駛著她的賽車。為了追上世界上最快的“玩家”,她幾度把車速飆到了每小時 140、150 英里。
這位「玩家」其實是名為 GT Sophy 的人工智慧。它是由索尼人工智慧研究實驗室在 2020 年發布的,利用人工智慧技術在 GT 遊戲中學習如何操控賽車。在 2021 年舉行的一系列閉門活動中,索尼安排了該人工智慧與頂尖 GT 賽車手同台競技。
2021 年 7 月,瓊斯作為電競戰隊 Trans Tasman Racing 的一員,參與了索尼組織的活動,但當時的她並不知道會發生什麼。
「沒人提供我任何資訊。只是跟我說不需要做任何練習,也不要在意圈速。」她回憶道。 「我的態度也很單純,保密就保密吧,這肯定不是什麼壞事。」
最後,GT Sophy 以1.5 秒的優勢擊敗了瓊斯的最佳成績——人類賽車手刷新GT 紀錄基本上都是以毫秒為單位的,1.5 秒意味著巨大的差距。
但索尼很快就了解到,僅憑速度並不足以讓 GT Sophy 成為贏家。它在單人賽道上超越了人類車手,以不可思議的成績打破了三個不同賽道的紀錄。
然而當索尼將其與多個人類車手放在一起比賽時,它卻輸掉了——多人競賽不僅需要速度,還需要一定的智慧。 GT Sophy 有時因過於激進和魯莽而招來罰分,有時則過於怯懦,在不需要的時候讓步。
Sony重新訓練了人工智慧,並在 2021 年 10 月進行了第二輪比賽。這一次,GT Sophy 輕鬆地贏下了人類玩家。它做出了什麼改變?
首先是索尼打造了一個更大的神經網絡,程式的性能更加強大,但本質上的不同之處在於 GT Sophy 學會了「賽道禮儀」。
美國負責人彼得沃曼()表示,這種禮儀被人類車手廣泛遵守,其實質是平衡攻擊性和讓步的能力,在時刻變化的賽場中動態選擇最合適的行為。
這也是讓 GT Sophy 超越賽車遊戲人工智慧的原因。他說,車手在賽道上的互動和禮節是一個特殊例子,其中展示的動態的、情境感知的行為,正是機器人在和人互動時應該具備的。
認識到何時冒險、何時安全行事,對於人工智慧來說十分有用,無論是在製造車間、家庭機器人,還是無人駕駛汽車上。
說:「我認為我們還沒有學會關於如何處理必須遵循的人類規範的一般原則。但這是一個好的開始,希望它能讓我們深入了解這個問題。」
GT Sophy 只是許多擊敗過人類的人工智慧系統中的其中一個,從國際象棋到星際爭霸和DOTA2,人工智慧都擊敗了世界上最好的人類選手。不過 GT 這個遊戲給了索尼一個新的挑戰。
與其他的、特別是那些回合製的遊戲不同,GT 要求頂尖玩家在逼近物理極限(超高車速)的情況下即時控制車輛。在競賽中,所有其他玩家都在做相同的事情。
虛擬賽車以每小時 100 英里的速度疾馳而過,車身與彎道邊緣的距離只有幾英寸。在這樣的速度下,微小的誤差都會導致碰撞。
據悉,GT 遊戲以詳盡地捕捉、並復刻真實世界的物理學而聞名,它模擬了賽車的空氣動力學和輪胎在賽道上的摩擦。這遊戲有時甚至被用來訓練和招募真實世界的賽車手。
瑞士蘇黎世大學機器人和感知小組的負責人(Davide Scaramuzza)說:「它在真實程度方面做得很好。」他並沒有參與GT Sophy 項目,但他的團隊曾使用GT 遊戲來訓練人工智慧駕駛員,目前尚未進行過針對人類的測試。
GT Sophy 參與遊戲的方法與人類玩家不同。它不會讀取螢幕上的像素,而是獲取有關自身在賽道上的位置和周圍汽車的位置的數據。它還會收到關於影響其車輛的虛擬物理力量的訊息。
作為回應,GT Sophy 控制汽車轉彎或煞車。這種 GT Sophy 與遊戲之間的互動每一秒進行 10 次,及其同事聲稱,這與人類玩家的反應時間相似。
Sony使用了強化學習,透過試誤的方法從零訓練 GT Sophy。起初,人工智慧只能努力讓汽車保持在路上行駛。
但经过在 10 台 PS4 上的训练后(每台运行 20 个程序实例),GT Sophy 在大约 8 小时内提升到了 GT 的内置人工智能水平,相当于业余玩家。在 24 小时内,它就接近了包含 17700 名人类玩家最佳成绩排行榜的最顶端。
GT Sophy 花了 9 天时间不断缩短圈速。最后,它比任何人类玩家都要快。
可以说,索尼的人工智能学会了如何在游戏允许的极限下驾驶,完成了人类玩家力所不能及的动作。令琼斯最为印象深刻的是 GT Sophy 的转弯方式,将刹车提前、以实现用更紧的走线加速出弯。
她说:“GT Sophy 以一种奇怪的方式对待走线,做了一些我甚至从未想过的事情。”例如 GT Sophy 经常把一个轮胎开到赛道边缘的草地上,然后滑进弯道。一般人不会那样做,因为太容易犯错了。这就像是你在控制一起碰撞事故。给我一百次机会,我也许只能成功一次。”
GT Sophy 很快就掌握了这个游戏的物理学,不过更大的问题是裁判。在职业赛场上,GT 比赛由人类裁判监督,他们有权对危险驾驶扣分。
累积惩罚是 GT Sophy 在 2021 年 7 月的第一轮比赛中失利的一个关键原因,尽管它比任何一个人类车手都要快。在几个月后的第二轮比赛中,它学会了如何规避惩罚失分,结果就大不相同了。
在 GT Sophy 上投入了数年的精力。他桌子后面的墙上挂着一幅两辆车争抢位置的画。“这是 GT Sophy 正在超越 Yamanaka,”他说。
他指的是顶尖 GT 日本车手 Tomoaki Yamanaka,他是 2021 年与 GT Sophy 比赛的四名日本职业模拟赛车手之一。
他不记得这幅画是哪一局比赛。如果是 2021 年 10 月的比赛,Yamanaka 很可能会乐在其中,因为他面对的是一个强大但公平的对手。如果这是 2022 年 7 月份的活动,他很可能会咒骂电脑莫名其妙。
Yamanaka 的队友 Takuma Miyazono 通过翻译软件向我们简单描述了 2022 年 7 月份的比赛。他说:“有几次我们被(GT Sophy)撞出赛道,因为它的过弯方式太过激进。这让我们很生气,因为人类玩家会在转弯时减速,以避免开出赛道。”
说,训练人工智能公平竞技且不失去竞争优势是十分困难的。人类裁判会做出取决于环境的主观判罚,这让人们很难将它们转化为人工智能可以学到的东西,比如哪些行为可以做,哪些不可以做。
索尼的研究人员尝试给人工智能提供许多不同的线索,供其调用和调整,希望能找到一种有效的组合。如果它偏离赛道或撞到围栏上,造成了车辆碰撞或可能被裁判判罚,那么它就会受到惩罚。
他们对每种惩罚的力度进行了实验、观察和调试,并且检查了 GT Sophy 的驾驶方式会如何发生变化。
索尼还增加了 GT Sophy 在训练中面临的竞争。在此之前,它主要针对自身的老版本进行训练。
在 2021 年 10 月份的重赛之前,索尼每隔一两周就会邀请顶级 GT 车手帮助测试人工智能,再综合结果不断调整。
“这给了我们所需的反馈,以便在攻击性和让步之间找到合适的平衡,”说。
这起到了效果。三个月后,当 Miyazono 与 GT Sophy 比赛时,后者的激进表现消失了——但它并不是简单地退缩。“当两辆车并排进入一个弯道时,GT Sophy 会给人类车手留下足够通过的空间,”他表示,“这让你感觉是在和另一个真人比赛。”
他补充说:“面对这种反应,车手会得到一种不同的激情和乐趣。这真的给我留下了深刻的印象。”
对索尼的工作印象深刻。他说:“我们用人类的能力来衡量机器人技术的进步。”但是,他的同事埃莉亚·考夫曼(Elia Kaufman)指出,仍然是人类研究人员主导了 GT Sophy 学习行为的训练。
“良好的赛道礼仪是由人类教给人工智能的,”他说,“如果这能以自动化的方式实现,那将真的很有趣。”这样的机器不仅会有良好的赛场风范,更主要的是可以理解什么是赛场风范,并且能够改变它的行为来适应新的设置。
的团队现在正在将其 GT 赛车研究,应用到现实世界的无人机比赛中,使用原始视频输入而不是模拟数据来训练人工智能飞行。2022 年 6 月,他们邀请了两名世界冠军级别的无人机飞手对抗电脑。
他说:“在看到我们的人工智能比赛后,他们的表情说明了一切。他们被震撼到了。”
他認為,機器人技術的真正進步必須要拓展到現實世界。 「在模擬和現實世界之間,總是會有一種不匹配的情況,」他說,「當人們談論人工智慧取得了令人難以置信的進步時,這一點就被遺忘了。在策略方面,是的。但就部署到現實世界而言,我們還差得很遠。」
目前,索尼仍堅持將技術僅用在遊戲中。它計劃將 GT Sophy 用於未來版本的 GT 遊戲中。 「我們希望這能成為產品的一部分,」美國的執行總監彼得·斯通()說。 「索尼是一家娛樂公司,我們希望這能讓遊戲更加有趣。」
瓊斯認為,一旦人們有機會觀摩 GT Sophy 的駕駛過程,那麼整個模擬賽車社群都可以從中學到很多東西。 「在許多賽道上,我們會發現很多沿襲了多年的駕駛技巧都是有缺陷的,實際上存在更快的方法。」
Miyazono 已經在嘗試複製人工智慧在彎道的走線方式,因為它已經展示了這是可以實現的。瓊斯說:「如果基準水準發生變化,那麼每個人的技術都會提升。」
以上是索尼AI擊敗頂級真人賽車手,以1.5秒優勢打敗人類的詳細內容。更多資訊請關注PHP中文網其他相關文章!

熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

Video Face Swap
使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱門文章

熱工具

記事本++7.3.1
好用且免費的程式碼編輯器

SublimeText3漢化版
中文版,非常好用

禪工作室 13.0.1
強大的PHP整合開發環境

Dreamweaver CS6
視覺化網頁開發工具

SublimeText3 Mac版
神級程式碼編輯軟體(SublimeText3)

本站6月27日訊息,剪映是由位元組跳動旗下臉萌科技開發的一款影片剪輯軟體,依託於抖音平台且基本面向該平台用戶製作短影片內容,並相容於iOS、安卓、Windows 、MacOS等作業系統。剪映官方宣布會員體系升級,推出全新SVIP,包含多種AI黑科技,例如智慧翻譯、智慧劃重點、智慧包裝、數位人合成等。價格方面,剪映SVIP月費79元,年費599元(本站註:折合每月49.9元),連續包月則為59元每月,連續包年為499元每年(折合每月41.6元) 。此外,剪映官方也表示,為提升用戶體驗,向已訂閱了原版VIP

透過將檢索增強生成和語意記憶納入AI編碼助手,提升開發人員的生產力、效率和準確性。譯自EnhancingAICodingAssistantswithContextUsingRAGandSEM-RAG,作者JanakiramMSV。雖然基本AI程式設計助理自然有幫助,但由於依賴對軟體語言和編寫軟體最常見模式的整體理解,因此常常無法提供最相關和正確的程式碼建議。這些編碼助手產生的代碼適合解決他們負責解決的問題,但通常不符合各個團隊的編碼標準、慣例和風格。這通常會導致需要修改或完善其建議,以便將程式碼接受到應

想了解更多AIGC的內容,請造訪:51CTOAI.x社群https://www.51cto.com/aigc/譯者|晶顏審校|重樓不同於網路上隨處可見的傳統問題庫,這些問題需要跳脫常規思維。大語言模型(LLM)在數據科學、生成式人工智慧(GenAI)和人工智慧領域越來越重要。這些複雜的演算法提升了人類的技能,並在許多產業中推動了效率和創新性的提升,成為企業保持競爭力的關鍵。 LLM的應用範圍非常廣泛,它可以用於自然語言處理、文字生成、語音辨識和推薦系統等領域。透過學習大量的數據,LLM能夠產生文本

大型語言模型(LLM)是在龐大的文字資料庫上訓練的,在那裡它們獲得了大量的實際知識。這些知識嵌入到它們的參數中,然後可以在需要時使用。這些模型的知識在訓練結束時被「具體化」。在預訓練結束時,模型實際上停止學習。對模型進行對齊或進行指令調優,讓模型學習如何充分利用這些知識,以及如何更自然地回應使用者的問題。但是有時模型知識是不夠的,儘管模型可以透過RAG存取外部內容,但透過微調使用模型適應新的領域被認為是有益的。這種微調是使用人工標註者或其他llm創建的輸入進行的,模型會遇到額外的實際知識並將其整合

機器學習是人工智慧的重要分支,它賦予電腦從數據中學習的能力,並能夠在無需明確編程的情況下改進自身能力。機器學習在各個領域都有廣泛的應用,從影像辨識和自然語言處理到推薦系統和詐欺偵測,它正在改變我們的生活方式。機器學習領域存在著多種不同的方法和理論,其中最具影響力的五種方法被稱為「機器學習五大派」。這五大派分別為符號派、聯結派、進化派、貝葉斯派和類推學派。 1.符號學派符號學(Symbolism),又稱符號主義,強調利用符號進行邏輯推理和表達知識。該學派認為學習是一種逆向演繹的過程,透過現有的

編輯|ScienceAI問答(QA)資料集在推動自然語言處理(NLP)研究中發揮著至關重要的作用。高品質QA資料集不僅可以用於微調模型,也可以有效評估大語言模型(LLM)的能力,尤其是針對科學知識的理解和推理能力。儘管目前已有許多科學QA數據集,涵蓋了醫學、化學、生物等領域,但這些數據集仍有一些不足之處。其一,資料形式較為單一,大多數為多項選擇題(multiple-choicequestions),它們易於進行評估,但限制了模型的答案選擇範圍,無法充分測試模型的科學問題解答能力。相比之下,開放式問答

本站8月1日消息,SK海力士今天(8月1日)發布博文,宣布將出席8月6日至8日,在美國加州聖克拉拉舉行的全球半導體記憶體峰會FMS2024,展示諸多新一代產品。未來記憶體和儲存高峰會(FutureMemoryandStorage)簡介前身是主要面向NAND供應商的快閃記憶體高峰會(FlashMemorySummit),在人工智慧技術日益受到關注的背景下,今年重新命名為未來記憶體和儲存高峰會(FutureMemoryandStorage),以邀請DRAM和儲存供應商等更多參與者。新產品SK海力士去年在

編輯|KX在藥物研發領域,準確有效地預測蛋白質與配體的結合親和力對於藥物篩選和優化至關重要。然而,目前的研究並沒有考慮到分子表面訊息在蛋白質-配體相互作用中的重要作用。基於此,來自廈門大學的研究人員提出了一種新穎的多模態特徵提取(MFE)框架,該框架首次結合了蛋白質表面、3D結構和序列的信息,並使用交叉注意機制進行不同模態之間的特徵對齊。實驗結果表明,該方法在預測蛋白質-配體結合親和力方面取得了最先進的性能。此外,消融研究證明了該框架內蛋白質表面資訊和多模態特徵對齊的有效性和必要性。相關研究以「S
