新しいAIテーマが次々と登場していますが、今回は「ロボットAI」との融合によって形成される身体化知能概念の番です。
「シリコンバレーの鉄人」マスク氏と、黒のレザージャケットを愛する「グラフィックスカードのゴッドファーザー」ジェンスン・ファン氏は、どちらも肯定的な発言をしており、これは一致しています。
同じ日、Nvidia の創設者兼 CEO のジェンスン フアン氏は、ITF World 2023 Semiconductor Conference で、現地時間 5 月 16 日、テスラの 2023 年年次株主総会が開催され、マスク氏は会議で 人型ロボットが将来のテスラの主要な長期価値の源泉になるだろうと述べました。 」
AI の次の波は「身体化されたインテリジェンス」になるだろうと述べました。また、Nvidia VIMA も発表しました。視覚的なテキストの手がかりに基づいて複雑なタスクを実行できる、マルチモーダルな具体化された人工知能システム。マスク氏は2021年から人型ロボットの可能性を強調し、「ロボット人工知能」の幅広い展望を揺るぎなく提案してきた。 AIGC(生成型AI)が熱い中、タイミングよく「身体化知能」という言葉が普及し、「ロボットAI」が再び表舞台に押し上げられました。今日のA株流通市場に反映され、関連銘柄は大幅に上昇し、多くの銘柄が1日の上限に達しました。引け時点では、MOONS Electric、Youde Precision、OBI Zhongguangが日足のストップ高となっている一方、Robotics、ArcSoft Technology、Yuntian Lifei、Haozhi Electromechanical、Eftなどが10%以上上昇した。
AIGC、身体化知能、ロボット、この 3 つはどのように結びついていますか?
テスラ ヒューマノイド ロボット≈身体化知能ロボット
マスクの人型ロボットについては、人々はすでによく知っています。最終用途の観点から見ると、テスラの人型ロボットと身体化された知的ロボットはほぼ同等です。
マスク氏のテスラロボットに関する長期目標は、ロボットが環境に適応して人間と同じことをできるようにして、料理、芝刈り、高齢者の世話など、何千もの家庭でサービスを提供できるようにすることです。身体化インテリジェント ロボットは、物理的な実体を持ち、現実世界とマルチモーダルに対話し、人間と同じように環境を認識して理解し、自律学習を通じてタスクを完了できるインテリジェント エージェントです。 NVIDIA のロボット研究シニア ディレクターでワシントン大学教授のディーター フォックス氏は以前、ロボット研究の重要な目標は現実世界で人間に役立つロボットを構築することであると指摘しました。
AIGC は、技術的なボトルネックを突破するための身体化インテリジェンスの新しいアイデアを提供します
身体化された知能は知能科学の基本的な問題であり、大きな問題です。 AIGC は、身体化されたインテリジェンスを実現するための新しいアイデアを提供します。
1950 年、チューリングは論文「コンピューティング機械とインテリジェンス」の中で身体化インテリジェンスの概念を初めて提案しました。今後数十年間、物理的知能は技術的な制約により大きな進歩を遂げませんでした。
スタンフォード大学のコンピューター サイエンス教授であるリー フェイフェイ氏は次のように述べています。 「
人間や環境とのインタラクションは、身体化されたインテリジェント ロボットが客観的な世界を理解し、変換する能力を開発するための最初のステップです。この点で、最も直接的な障害は、人々が手書きのコードに大きく依存していることです。制御ロボット「バベルの塔」が人間と人工知能の前にそびえ立つ。
AIGC の時代では、GPT などの大規模 AI モデルが新しいソリューションを提供してきました。多くの研究者が、人間とロボット間のコミュニケーションの橋渡しとしてマルチモーダル大規模言語モデルを使用しようと試みてきました。つまり、画像、テキスト、具現化されたデータを共同でトレーニングし、マルチモーダル入力を導入することで、モデルによる現実のオブジェクトの理解を強化し、ロボットが具現化された推論タスクを処理できるようにすることができます。
Microsoft、Google、Alibaba などが積極的に検討中です
現在、身体性インテリジェンスは国際的な学術フロンティア研究の方向性となっており、米国国立科学財団などの機関が身体性インテリジェンスの開発を推進しており、主要な国際学会でも身体性インテリジェンスにますます注目が集まり始めています。インテリジェンス関連の研究については、米国の一流大学が具体的なインテリジェンス研究コミュニティを形成し始めています。業界も急速に進歩しており、Google と Microsoft が主導権を握り、両社とも大型モデルのロボットに魂を注入しようとしています。前者の PaLM-E モデルは、身体化された知能と切り離すことができません。身体化されたロボットのタスクを完了することが、常にこのモデルの研究の焦点でした。後者は、OpenA によって開発された ChatGPT をロボット工学の分野に拡張する方法を模索しています。言語を備えた機械などの制御機械、武器、ドローン、家庭支援ロボット、その他のプラットフォーム。
中国では、 アリババも Qianwen 大型モデルを産業用ロボットに接続する実験を行っています DingTalk ダイアログ ボックスに人間の言葉で文章を入力することで、ロボットに遠隔から動作を命令することができます。
投資の主軸がますます明確になりました技術的な観点から見ると、身体化されたインテリジェンスの実現は、知覚、想像力、実行という 3 つの主要なリンクから切り離すことができません。具体的には、具現化された知能ロボットを実現するためには、柔軟な思考力、強力な実行力、人との優れたコミュニケーション能力、そして人間らしい自己学習能力が必要となります。
強力な実行は、ロボットの物理的な周辺機器、つまり機械本体と基本的な動作制御に依存します。知覚と想像力は、ロボットの聞く、見る、話す能力に外部化できます。マシンの使用 ビジョン、ディープラーニング、強化学習などのさまざまな AI テクノロジーは、ソフトウェアとアルゴリズムを最適化し、テキスト、ビジョン、音声、トレーニング用のシーンなど、さまざまな環境にわたる多数のデータセットを使用します。
多くの機関は、ロボット産業、マルチモーダル大型モデル、マシンビジョンテクノロジーが新たな収益の方向性であると信じています。国盛証券は、「マルチモーダル GPT はロボット産業の発展に大きく貢献できる。今後 5 ~ 10 年で、複雑なマルチモーダル ソリューションと組み合わせた大型モデルは、世界と対話し、さまざまな分野で応用できる完全な機能を備えるようになることが期待される」と述べた。一般ロボットなどの分野; 天豊国際証券は、AIはマシンビジョンの母であり、ディープラーニングはマシンビジョンの技術的要塞であると述べました。メタによるSAMモデルの最近のリリースは、マシンビジョンがGPTの瞬間を迎えるのに役立つと期待されています。
上記の業界またはそれに対応するテクノロジーを持つ企業が注目を集めています。 Interactive Yishang、Lingyunguang、Huichuan Technology、Haitian Ruixiang などの上場企業はいずれも、具現化されたインテリジェンスとの関連について投資家から疑問視されています。その中で、凌雲光は、マルチモーダル融合技術を使用して複数のシナリオで顧客のインテリジェント製造ニーズを解決しており、これは身体化インテリジェンスの開発に必要なステップであると明確に回答した数少ない企業の1つです。 Science and Technology Innovation Board Daily による不完全なレビューによると、機関研究レポートと組み合わせると、次の企業も注目を集めています:
出典: Science and Technology Innovation Board Daily
以上がAIGC+ロボット=身体化された知能?シリコンバレーで最もクールな 2 人が偶然共演し、A 株が「次の波」を予感させるの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。