ソニーの AI が人間のトップレーサーを破り、人間を 1.5 秒上回った

WBOY
リリース: 2023-04-09 08:21:02
転載
1367 人が閲覧しました

ソニーの AI が人間のトップレーサーを破り、人間を 1.5 秒上回った

「何が起こっているの?」 エミリー・ジョーンズは自分が後れをとっていることが信じられませんでした。

エミリー ジョーンズは、複数のチャンピオンシップで優勝したトップ GT ゲーム レーサーです。彼女は、e スポーツ専用ステアリング ホイールを叩き、目の前のスクリーンを見つめました。「ベストを尽くしましたが、まだ無理です」

ゲーム「グランツーリスモ」では、ジョーンズは時速 190 マイルで車を運転します。世界最速の「選手」たちに追いつくために、彼女は時速140マイルと150マイルの速度で運転した。

この「プレイヤー」の正体は、GT ソフィーという人工知能です。 2020 年にソニーの人工知能研究所によってリリースされたこのゲームは、GT ゲームで車を制御する方法を学習するために人工知能技術を使用しています。ソニーは2021年の一連の非公開イベントで、トップGTレーサーとAIを対戦させた。

2021年7月、ジョーンズさんはeスポーツチーム「トランス・タスマン・レーシング」のメンバーとしてソニー主催のイベントに参加しましたが、当時は何が起こるかわかりませんでした。

「誰も私に何も情報をくれませんでした。ただ、練習する必要はないし、ラップタイムのことは気にしなくてもいいと言われたんです」と彼女は思い起こす。 「私の態度も非常に単純です。秘密にしておいてください。これは決して悪いことではありません。」

最終的に、GT ソフィーはジョーンズのベストリザルトを 1.5 秒上回りました。人間のレーサーが GT を破りました。レコード 基本的にはミリ秒単位で測定され、1.5 秒は大きな違いを意味します。

しかし、ソニーは、GT ソフィーを勝者にするためにはスピードだけでは不十分であることをすぐに学びました。単一のトラックで人間のドライバーのパフォーマンスを上回り、3 つの異なるトラックで信じられないほどの結果をもたらし、記録を破りました。

しかし、ソニーが複数の人間ドライバーと対戦させたところ、負けてしまいました。マルチプレイヤー レースにはスピードだけでなく、ある程度の知性も必要です。 GT ソフィーは、あまりにも攻撃的で無謀なためにペナルティを受けることもあれば、必要のないときに屈服して臆病になることもありました。

ソニーはAIを再トレーニングし、2021年10月に第2ラウンドを実施した。今回は、GT Sophy が人間のプレイヤーを簡単に倒しました。どのような変化があったのでしょうか?

まず第一に、ソニーはより大規模なニューラル ネットワークを構築し、プログラムのパフォーマンスはより強力になりました。しかし、本質的な違いは、GT Sophy が「トラック エチケット」を学習したことです。

アメリカのピーター・ウォーマン長官は、「このエチケットは人間のドライバーによって広く守られている。その本質は、攻撃性と譲歩のバランスをとり、刻々と変化する分野で最も適切な行動を動的に選択する能力である」と述べた。

これが、GT Sophy がレース ゲームの人工知能を超える理由でもあります。同氏は、ドライバーのコース上でのやり取りやエチケットは、人とやり取りする際にロボットがとるべきダイナミックで状況を認識した行動の特別な例であると述べた。

いつリスクを冒すべきか、いつ安全策を講じるべきかを知ることは、製造現場、家庭用ロボット、自動運転車のいずれにおいても、人工知能にとって役立ちます。

は次のように述べています。「私たちは、従わなければならない人間の規範にどのように対処するかについての一般原則を学んでいないと思います。しかし、これは良いスタートであり、願わくば、これにより私たちがより深く理解できるようになります。」

GT Sophy は、チェスから StarCraft や DOTA2 に至るまで、人間に勝った数多くの AI システムの 1 つにすぎません。AI は世界最高の人間のプレイヤーに勝ちました。しかし、GT はソニーに新たな挑戦をもたらします。

他のゲーム、特にターンベースのゲームとは異なり、GT ではトップ プレーヤーが物理の限界 (超高速) に近づきながら車両をリアルタイムで制御する必要があります。競争では、他のすべてのプレイヤーが同じことをしています。

仮想レースカーは、カーブの端からわずか数インチのところで時速 160 マイルでズームインします。このような速度では、小さな誤差が衝突につながる可能性があります。

GT ゲームは、現実世界の物理学を詳細にキャプチャして再現することで有名であると報告されており、車の空気力学やトラック上のタイヤの摩擦をシミュレートします。このゲームは、現実世界のレーサーの訓練や採用にも使用されることがあります。

スイスのチューリッヒ大学のロボット工学と知覚グループの責任者である Davide Scaramuzza 氏は、「リアリズムの点で良い仕事をしています。」と述べました。チームは人工知能ドライバーを訓練するために GT ゲームを使用しましたが、人間ではまだテストされていません。

GT ソフィーは人間のプレイヤーとは異なる方法でゲームに参加します。画面上のピクセルを読み取る代わりに、トラック上の自分の位置と周囲の車の位置に関するデータを取得します。また、車両に影響を与える仮想物理的な力に関する情報も受け取ります。

これに応じて、GT Sophy は車を制御して方向転換したり、ブレーキをかけたりします。 GT Sophy とゲームの間のこのやり取りは 1 秒あたり 10 回行われ、その同僚は人間のプレイヤーの反応時間と同様であると主張しました。

ソニーは強化学習を使用して、試行錯誤の方法で GT Sophy をゼロからトレーニングしました。当初、AI は車を道路上に走行させ続けることしかできませんでした。

しかし、10 台の PS4 (それぞれがプログラムの 20 インスタンスを実行) でトレーニングした後、GT Sophy は約 8 時間でアマチュア プレーヤーと同等の GT 内蔵人工知能のレベルまで向上しました。 24 時間以内に、17,700 人の人間プレイヤーの最高成績のリーダーボードのトップ近くになりました。

GT Sophy は 9 日間を費やしてラップタイムを短縮しました。最終的には、人間のどのプレイヤーよりも速かったのです。

ソニーの人工知能は、ゲームで許される限界での運転方法を学習し、人間のプレイヤーの能力を超えたアクションを完成させたと言えます。ジョーンズが最も感銘を受けたのは、タイトなルーティングでコーナーから加速するために早めにブレーキをかけて GT ソフィーが曲がる様子でした。

彼女はこう言いました:「GT ソフィーはラインの処理が奇妙で、私が考えもしなかったことをやります。」たとえば、GT ソフィーはよくタイヤをトラックの端の芝生に飛ばします。 、コーナーに滑り込みます。間違いを犯しやすいため、ほとんどの人はそうしません。まるでクラッシュをコントロールしているようだ。百回チャンスをくれても、成功するのは一度だけかもしれない。 「

GT ソフィーはゲームの物理学をすぐに理解しましたが、より大きな問題は審判でした。プロの競技場では、GT レースは人間の審判によって監督されており、危険な運転に対して減点する権限を持っています。

GT ソフィーは、人間のドライバーよりも速かったにもかかわらず、2021 年 7 月の第 1 ラウンドで敗退した主な理由は、累積ペナルティでした。数か月後の第 2 ラウンドでは、ペナルティポイントを回避する方法を学び、その結果は世界に大きな違いをもたらしました。

彼は GT ソフィーに数年間投資してきました。彼の机の後ろの壁には、ポジションを争う 2 台の車の写真が掛けられています。絵を描きます。「これは、山中を引き継ぐ GT ソフィーです」と彼は言いました.

彼は、2021 年に GT ソフィーとレースする 4 人の日本人プロ シム レーサーのうちの 1 人である、日本のトップ GT ドライバー、山中智章について言及していました。 .

彼は、この写真がどのゲームのものなのか思い出せません。 2021 年 10 月の試合であれば、山中は強力だが公平な相手と対戦するため、おそらく楽しむだろうが、これが 2022 年 7 月の試合であれば、おそらく混乱しているとコンピューターを呪うことになるだろう。山中選手のチームメイトである宮園拓真選手は、2022年7月の出来事を翻訳ソフトを通じて私たちに簡単に説明し、「(GTソフィーの)コーナリングがあまりにもアグレッシブすぎたために、コースからはね飛ばされることが何度かあった。人間のプレイヤーはコースから外れないようにターン中に速度を落とすので、これには腹が立ちました。 「

氏は、競争上の優位性を失わずに公正にプレーできるように人工知能を訓練するのは非常に難しいと述べました。人間の審判は環境に依存する主観的な判定を行うため、それを人工知能が学習できるものに変換することが困難になります。」

ソニーの研究者は、効果的な組み合わせを見つけることを期待して、人工知能が呼び出して調整するためのさまざまな手がかりを人工知能に提供しようとしています。

彼らは、各ペナルティの強度を実験、観察、デバッグし、GT ソフィーの運転方法がどのようになるかを確認しました。変更.

ソニーはまた、GT ソフィーがトレーニングで直面する競争を増やしました。これまでは、主に古いバージョンに対してトレーニングしていました。

2021 年 10 月の再戦の前に、ソニーはトップを招待しますGT ドライバーは毎週、または 2 週間ごとに人工知能のテストを支援し、結果を総合的に調整します。

「これにより、攻撃性と譲歩の間の適切なバランスを見つけるために必要なフィードバックが得られます。」と述べました。

それはうまくいきました。3 か月後、宮園選手が GT ソフィーと対戦したとき、宮園選手のアグレッシブなパフォーマンスは消えていました。しかし、それは単に我慢することではありません。「2 台の車が並んでコーナーに進入するとき、GT ソフィーは十分な残量を残します」人間のドライバーが通過できるスペースが必要です」と彼は言いました。 「

彼は次のように付け加えました。「この種の反応に直面すると、ライダーは別の種類の情熱と楽しみを感じます。これには本当に感動しました。 「

はソニーの取り組みに深く感銘を受けました。彼は次のように言いました。「私たちはロボット技術の進歩を測定するために人間の能力を利用しています。しかし、彼の同僚のエリア・カウフマン氏は、GT ソフィーの学習行動の訓練を主導していたのは依然として人間の研究者だったと指摘する。

「良いトラックエチケットは人間によって教えられる。人工知能だ」と彼は言った。これが自動化された方法で実行できれば非常に興味深いでしょう。 「そのようなマシンは、優れたトラックマナーを備えているだけでなく、より重要なのは、トラックマナーとは何かを理解し、新しい設定に適応するために動作を変更できることです。

のチームは現在、GTの開発に取り組んでいます」レース , 現実世界のドローン競技に適用され、人工知能飛行を訓練するためにシミュレートされたデータの代わりに生のビデオ入力を使用. 2022 年 6 月、彼らは 2 人の世界選手権レベルのドローン パイロットをコンピューターとの競争に招待しました。 「私たちのAIのプレーを見た後の彼らの顔がすべてを物語っていました。彼らはショックを受けました。 「

彼は、ロボット工学の真の進歩は現実世界にも拡張されなければならないと信じています。 「シミュレーションと現実世界の間には常に不一致が存在します。人工知能の驚異的な進歩について人々が語るとき、それは忘れ去られてしまいます。戦略的な側面ではそうです。しかし、社会への展開という点では、その通りです」と彼は言いました。現実の世界では、私たちはまだ遠いところにいます。」

今のところ、ソニーは依然としてこの技術をゲームでのみ使用することを主張しています。 GT Sophy は GT ゲームの将来のバージョンで使用される予定です。同社のエグゼクティブディレクター、ピーター・ストーン氏は「われわれはこれを製品の一部にしたいと考えている」と語った。 「ソニーはエンターテイメント企業であり、これによってゲームがより楽しくなることを願っています。」 ジョーンズ氏は、人々が GT ソフィーのハンドルを握っているのを見る機会を得れば、シム レーシング コミュニティ全体が多くのことを学べると信じています。 「多くのコースでは、長年使用されてきた運転テクニックの多くに欠陥があることがわかります。実際には、もっと速い方法があります。」

宮園はすでに、人工知能のルーティングを再現しようとしている。これが達成できることが示されているため、隅々まで進みます。 「ベースラインが変われば、全員のスキルが向上します」とジョーンズ氏は言いました。

以上がソニーの AI が人間のトップレーサーを破り、人間を 1.5 秒上回ったの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

ソース:51cto.com
このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。
最新の問題
人気のチュートリアル
詳細>
最新のダウンロード
詳細>
ウェブエフェクト
公式サイト
サイト素材
フロントエンドテンプレート
私たちについて 免責事項 Sitemap
PHP中国語ウェブサイト:福祉オンライン PHP トレーニング,PHP 学習者の迅速な成長を支援します!