索尼AI擊敗頂級真人賽車手,以1.5秒優勢打敗人類

WBOY
發布: 2023-04-09 08:21:02
轉載
1417 人瀏覽過

索尼AI擊敗頂級真人賽車手,以1.5秒優勢打敗人類

「這是什麼情況?」艾蜜莉瓊斯(Emily Jones)不敢相信自己竟然落後了。

艾米麗瓊斯是一名多次奪冠的頂級GT 遊戲賽車手,她拍打著她的電競專用方向盤,眼睛盯著面前的螢幕:「我盡力了,但還是追不上它——它是怎麼做到的?」

在遊戲GT(Gran Turismo)中,瓊斯以每小時120 英里的速度駕駛著她的賽車。為了追上世界上最快的“玩家”,她幾度把車速飆到了每小時 140、150 英里。

這位「玩家」其實是名為 GT Sophy 的人工智慧。它是由索尼人工智慧研究實驗室在 2020 年發布的,利用人工智慧技術在 GT 遊戲中學習如何操控賽車。在 2021 年舉行的一系列閉門活動中,索尼安排了該人工智慧與頂尖 GT 賽車手同台競技。

2021 年 7 月,瓊斯作為電競戰隊 Trans Tasman Racing 的一員,參與了索尼組織的活動,但當時的她並不知道會發生什麼。

「沒人提供我任何資訊。只是跟我說不需要做任何練習,也不要在意圈速。」她回憶道。 「我的態度也很單純,保密就保密吧,這肯定不是什麼壞事。」

最後,GT Sophy 以1.5 秒的優勢擊敗了瓊斯的最佳成績——人類賽車手刷新GT 紀錄基本上都是以毫秒為單位的,1.5 秒意味著巨大的差距。

但索尼很快就了解到,僅憑速度並不足以讓 GT Sophy 成為贏家。它在單人賽道上超越了人類車手,以不可思議的成績打破了三個不同賽道的紀錄。

然而當索尼將其與多個人類車手放在一起比賽時,它卻輸掉了——多人競賽不僅需要速度,還需要一定的智慧。 GT Sophy 有時因過於激進和魯莽而招來罰分,有時則過於怯懦,在不需要的時候讓步。

Sony重新訓練了人工智慧,並在 2021 年 10 月進行了第二輪比賽。這一次,GT Sophy 輕鬆地贏下了人類玩家。它做出了什麼改變?

首先是索尼打造了一個更大的神經網絡,程式的性能更加強大,但本質上的不同之處在於 GT Sophy 學會了「賽道禮儀」。

美國負責人彼得沃曼()表示,這種禮儀被人類車手廣泛遵守,其實質是平衡攻擊性和讓步的能力,在時刻變化的賽場中動態選擇最合適的行為。

這也是讓 GT Sophy 超越賽車遊戲人工智慧的原因。他說,車手在賽道上的互動和禮節是一個特殊例子,其中展示的動態的、情境感知的行為,正是機器人在和人互動時應該具備的。

認識到何時冒險、何時安全行事,對於人工智慧來說十分有用,無論是在製造車間、家庭機器人,還是無人駕駛汽車上。

說:「我認為我們還沒有學會關於如何處理必須遵循的人類規範的一般原則。但這是一個好的開始,希望它能讓我們深入了解這個問題。」

GT Sophy 只是許多擊敗過人類的人工智慧系統中的其中一個,從國際象棋到星際爭霸和DOTA2,人工智慧都擊敗了世界上最好的人類選手。不過 GT 這個遊戲給了索尼一個新的挑戰。

與其他的、特別是那些回合製的遊戲不同,GT 要求頂尖玩家在逼近物理極限(超高車速)的情況下即時控制車輛。在競賽中,所有其他玩家都在做相同的事情。

虛擬賽車以每小時 100 英里的速度疾馳而過,車身與彎道邊緣的距離只有幾英寸。在這樣的速度下,微小的誤差都會導致碰撞。

據悉,GT 遊戲以詳盡地捕捉、並復刻真實世界的物理學而聞名,它模擬了賽車的空氣動力學和輪胎在賽道上的摩擦。這遊戲有時甚至被用來訓練和招募真實世界的賽車手。

瑞士蘇黎世大學機器人和感知小組的負責人(Davide Scaramuzza)說:「它在真實程度方面做得很好。」他並沒有參與GT Sophy 項目,但他的團隊曾使用GT 遊戲來訓練人工智慧駕駛員,目前尚未進行過針對人類的測試。

GT Sophy 參與遊戲的方法與人類玩家不同。它不會讀取螢幕上的像素,而是獲取有關自身在賽道上的位置和周圍汽車的位置的數據。它還會收到關於影響其車輛的虛擬物理力量的訊息。

作為回應,GT Sophy 控制汽車轉彎或煞車。這種 GT Sophy 與遊戲之間的互動每一秒進行 10 次,及其同事聲稱,這與人類玩家的反應時間相似。

Sony使用了強化學習,透過試誤的方法從零訓練 GT Sophy。起初,人工智慧只能努力讓汽車保持在路上行駛。

但经过在 10 台 PS4 上的训练后(每台运行 20 个程序实例),GT Sophy 在大约 8 小时内提升到了 GT 的内置人工智能水平,相当于业余玩家。在 24 小时内,它就接近了包含 17700 名人类玩家最佳成绩排行榜的最顶端。

GT Sophy 花了 9 天时间不断缩短圈速。最后,它比任何人类玩家都要快。

可以说,索尼的人工智能学会了如何在游戏允许的极限下驾驶,完成了人类玩家力所不能及的动作。令琼斯最为印象深刻的是 GT Sophy 的转弯方式,将刹车提前、以实现用更紧的走线加速出弯。

她说:“GT Sophy 以一种奇怪的方式对待走线,做了一些我甚至从未想过的事情。”例如 GT Sophy 经常把一个轮胎开到赛道边缘的草地上,然后滑进弯道。一般人不会那样做,因为太容易犯错了。这就像是你在控制一起碰撞事故。给我一百次机会,我也许只能成功一次。”

GT Sophy 很快就掌握了这个游戏的物理学,不过更大的问题是裁判。在职业赛场上,GT 比赛由人类裁判监督,他们有权对危险驾驶扣分。

累积惩罚是 GT Sophy 在 2021 年 7 月的第一轮比赛中失利的一个关键原因,尽管它比任何一个人类车手都要快。在几个月后的第二轮比赛中,它学会了如何规避惩罚失分,结果就大不相同了。

在 GT Sophy 上投入了数年的精力。他桌子后面的墙上挂着一幅两辆车争抢位置的画。“这是 GT Sophy 正在超越 Yamanaka,”他说。

他指的是顶尖 GT 日本车手 Tomoaki Yamanaka,他是 2021 年与 GT Sophy 比赛的四名日本职业模拟赛车手之一。

他不记得这幅画是哪一局比赛。如果是 2021 年 10 月的比赛,Yamanaka 很可能会乐在其中,因为他面对的是一个强大但公平的对手。如果这是 2022 年 7 月份的活动,他很可能会咒骂电脑莫名其妙。

Yamanaka 的队友 Takuma Miyazono 通过翻译软件向我们简单描述了 2022 年 7 月份的比赛。他说:“有几次我们被(GT Sophy)撞出赛道,因为它的过弯方式太过激进。这让我们很生气,因为人类玩家会在转弯时减速,以避免开出赛道。”

说,训练人工智能公平竞技且不失去竞争优势是十分困难的。人类裁判会做出取决于环境的主观判罚,这让人们很难将它们转化为人工智能可以学到的东西,比如哪些行为可以做,哪些不可以做。

索尼的研究人员尝试给人工智能提供许多不同的线索,供其调用和调整,希望能找到一种有效的组合。如果它偏离赛道或撞到围栏上,造成了车辆碰撞或可能被裁判判罚,那么它就会受到惩罚。

他们对每种惩罚的力度进行了实验、观察和调试,并且检查了 GT Sophy 的驾驶方式会如何发生变化。

索尼还增加了 GT Sophy 在训练中面临的竞争。在此之前,它主要针对自身的老版本进行训练。

在 2021 年 10 月份的重赛之前,索尼每隔一两周就会邀请顶级 GT 车手帮助测试人工智能,再综合结果不断调整。

“这给了我们所需的反馈,以便在攻击性和让步之间找到合适的平衡,”说。

这起到了效果。三个月后,当 Miyazono 与 GT Sophy 比赛时,后者的激进表现消失了——但它并不是简单地退缩。“当两辆车并排进入一个弯道时,GT Sophy 会给人类车手留下足够通过的空间,”他表示,“这让你感觉是在和另一个真人比赛。”

他补充说:“面对这种反应,车手会得到一种不同的激情和乐趣。这真的给我留下了深刻的印象。”

对索尼的工作印象深刻。他说:“我们用人类的能力来衡量机器人技术的进步。”但是,他的同事埃莉亚·考夫曼(Elia Kaufman)指出,仍然是人类研究人员主导了 GT Sophy 学习行为的训练。

“良好的赛道礼仪是由人类教给人工智能的,”他说,“如果这能以自动化的方式实现,那将真的很有趣。”这样的机器不仅会有良好的赛场风范,更主要的是可以理解什么是赛场风范,并且能够改变它的行为来适应新的设置。

的团队现在正在将其 GT 赛车研究,应用到现实世界的无人机比赛中,使用原始视频输入而不是模拟数据来训练人工智能飞行。2022 年 6 月,他们邀请了两名世界冠军级别的无人机飞手对抗电脑。

他说:“在看到我们的人工智能比赛后,他们的表情说明了一切。他们被震撼到了。”

他認為,機器人技術的真正進步必須要拓展到現實世界。 「在模擬和現實世界之間,總是會有一種不匹配的情況,」他說,「當人們談論人工智慧取得了令人難以置信的進步時,這一點就被遺忘了。在策略方面,是的。但就部署到現實世界而言,我們還差得很遠。」

目前,索尼仍堅持將技術僅用在遊戲中。它計劃將 GT Sophy 用於未來版本的 GT 遊戲中。 「我們希望這能成為產品的一部分,」美國的執行總監彼得·斯通()說。 「索尼是一家娛樂公司,我們希望這能讓遊戲更加有趣。」

瓊斯認為,一旦人們有機會觀摩 GT Sophy 的駕駛過程,那麼整個模擬賽車社群都可以從中學到很多東西。 「在許多賽道上,我們會發現很多沿襲了多年的駕駛技巧都是有缺陷的,實際上存在更快的方法。」

Miyazono 已經在嘗試複製人工智慧在彎道的走線方式,因為它已經展示了這是可以實現的。瓊斯說:「如果基準水準發生變化,那麼每個人的技術都會提升。」

以上是索尼AI擊敗頂級真人賽車手,以1.5秒優勢打敗人類的詳細內容。更多資訊請關注PHP中文網其他相關文章!

來源:51cto.com
本網站聲明
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn
最新問題
熱門教學
更多>
最新下載
更多>
網站特效
網站源碼
網站素材
前端模板
關於我們 免責聲明 Sitemap
PHP中文網:公益線上PHP培訓,幫助PHP學習者快速成長!