今年の11月、再びワールドカップが始まります。
そのとき、私たちがプレーするかどうか、良いプレーをするかどうかに関係なく、多くの人が再びサッカーについて話し始めるでしょう。
まさか、サッカーを世界最大のスポーツと呼ぶ人はいないでしょう。
しかし、科学者はワールド カップと比較して、毎年開催されるロボット カップ 3D シミュレーション リーグにより多くの関心を持っています。
つい最近、英国の人工知能企業 DeepMind の研究チームは、スポーツ コースの高速バージョンを使用して、コンピューターを通じて数十年分のサッカーの試合をシミュレートし、AI の学習を訓練しました。デジタルヒューマノイドサッカー選手を上手にコントロールする方法。
関連研究は、Science Robotics 誌に掲載されました。
論文アドレス: https://www.science.org/doi/10.1126/scirobotics.abo0235
もちろん、「AI サッカー選手」が世間の注目を集めるのはこれが初めてではありません。
AI サッカー選手の進化の簡単な歴史
すでに 2016 年、AlphaGo が囲碁でイ セドルを破ってから間もなく、Deepmind はAI にサッカーをさせてみようか、と考え始めました。
その年の 6 月、DeepMind の研究者は AI に、アリの形をしたオブジェクトを制御してボールを追いかけ、ボールがゴールに送られるまでドリブルして得点するよう依頼しました。
DeepMind チームのリーダーである David Silver 氏によると、Google が新たに開発した非同期 Actor-Critic アルゴリズム、つまり A3C の助けにより、AI はプロジェクトを完了しただけでなく、プロジェクトを継続したとのことです。プロセス全体を通してそれを使用するには、彼は機械について教える必要があります。
この実験により、「AI Football Playing」は良いスタートを切りました。
2019 年までに、DeepMind はさまざまなトレーニング プランから作成された多くの「プレーヤー」をトレーニングし、その中から 2 人制サッカー チームを 10 チーム選択しました。
これら 10 チームのそれぞれには 250 億フレームの学習経験があり、DeepMind はチーム間で 100 万のゲームを収集しました。
次に、DeepMind は複数の AI が一緒にサッカーの試合をできる環境を設定し、個々の「AI プレーヤー」を奨励するのではなく、「サッカー チーム」全体に報酬を与えるルールを事前に設定します。結果を反映してチーム全体の進歩を促進します。
DeepMind は、この方法で AI が互いに協力できることを証明しました。
#すべてが順調に進んでいるように見えましたが、2020 年、DeepMind の AI プレーヤーは問題を抱えていました。 Brain JiTi が提供した情報によると、試合中、一方のチームのサッカー ロボットがゴールを目指して一列に並んだが、ロボットのゴールキーパーは守る準備ができていませんでした。彼は地面に倒れ、足を激しく振り始めた。#これで終わりだと思いますか?素朴すぎる!
その後、前方のロボットプレイヤーが足を踏み鳴らしたり、手を振ったりする非常にわかりにくいダンスをして、ドスンと地面に倒れました。
このシーンは聴衆に衝撃を与えました。人々が解放されるのは見たことがありますが、これほど解放されるのは見たことがありません。 ############ なぜこうなった?
これも、その背後にある原理から始まります。
「AI Playing Football」の開始時に、研究者は強化学習の道を採用しました。
以前、AlphaGo の学習は教師あり学習、つまりラベル付きデータセットによるトレーニングに基づいていました。
しかし、この方法にはデータの「クリーンさ」に対する高い要件があります。データに問題があると、AI は間違いを犯すことになります。
対照的に、強化学習は人間の学習モデルを模倣しており、AI は「試行錯誤」方式で学習し、正しい場合には報酬を与え、間違っている場合には罰を与えることで、正しい接続を行ってください。
従来の教師あり学習よりもはるかに賢明であるように見えますが、まだ抜け穴があります。
たとえば、AI は報酬と罰について誤った理解を持ち、奇妙な戦略を生成します。
OpenAI はかつてボート ゲームを設計しましたが、AI の本来のタスクはレースを完走することでした。
研究者らは 2 つの報酬を設定しました。1 つはゲームを完了すること、もう 1 つは環境内でスコアを収集することです。結果は、エージェントがエリアを見つけてそこを回り続けて「ポイントを獲得」したというもので、最終的には当然ゲームクリアにはならなかったものの、スコアは高かった。
今回は、AIがどんな新たな技を披露したのかAIがサッカーをしたときに逆転はありましたが、研究者たちは諦めませんでした。
記事の冒頭で、DeepMind の研究チームが「AI サッカー選手」のトレーニングにおいて新たな進歩を遂げたと述べました。
論文の説明によると、DeepMindチームはこの研究でゲームルールを簡素化し、両チームのプレイヤー数を2~3人に制限したが、「AIサッカー選手」はボールを持った突破や物理的な対決を完了することができるという。 、精密射撃およびその他のアクション。
では、研究者はどのようにして「AI サッカー選手」を育成しているのでしょうか?
簡単に言えば、教師あり学習と強化学習を組み合わせたものです。
最初のステップでは、AI はサッカーをしている人間のビデオクリップを見て、自然な歩き方を学習する必要があります。AI はサッカー上で何をすべきかわからないからです。まずはフィールド。
第 2 ステップでは、AI が強化学習アルゴリズムの下でドリブルとシュートを練習します。
AI はこれら 2 つのステップを約 24 時間で完了できます。
第 3 のステップは、競技形式でのトレーニングです。AI ロボットは 2 対 2 の競技を実施します。このステップには 2 ~ 3 週間かかります。主に、 AIはチームワークを学習し、パスの予測などのより困難なモーション制御を学習します。
今回の「AIサッカー選手」のパフォーマンスには、それでも研究チームは非常に満足しました。
DeepMind チームは、この研究が人間レベルの運動知能に向けた人工システムの進歩を促進すると信じています。
しかし、DeepMind チームはまだ比較的冷静で、この画期的な進歩にはまだ限界があることを認識しています。
たとえば、実際のサッカーの試合で一般的に使用される 11 対 11 ではなく、2 対 2 のゲームですが、これは AI がより複雑なサッカーの試合に参加できることを意味するものではありません。
さらに、単純な 2 対 2 の試合であっても、ロボット ハードウェアでは直接使用することはできません。
言い換えれば、科学者たちはサッカーができるロボットをまだ開発できていないのです。
参考: https://www.science.org/doi/10.1126/scirobotics.abo0235
https://sports.yahoo.com/deepmind-ai -now-play-football-134345563.html?guccounter=2
https://www.woshipm.com/ai/3619952.htmlhttp://it.people.com.cn/n1/2016 / 0622/c1009-28467916.html
以上がAIは「サッカーをする」ことができるが、AIロボットはまだできないの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。