AIGC+ロボット=身体化された知能?シリコンバレーで最もクールな 2 人が偶然共演し、A 株が「次の波」を予感させる
新しいAIテーマが次々と登場していますが、今回は「ロボットAI」との融合によって形成される身体化知能概念の番です。
「シリコンバレーの鉄人」マスク氏と、黒のレザージャケットを愛する「グラフィックスカードのゴッドファーザー」ジェンスン・ファン氏は、どちらも肯定的な発言をしており、これは一致しています。
同じ日、Nvidia の創設者兼 CEO のジェンスン フアン氏は、ITF World 2023 Semiconductor Conference で、現地時間 5 月 16 日、テスラの 2023 年年次株主総会が開催され、マスク氏は会議で 人型ロボットが将来のテスラの主要な長期価値の源泉になるだろうと述べました。 」
AI の次の波は「身体化されたインテリジェンス」になるだろうと述べました。また、Nvidia VIMA も発表しました。視覚的なテキストの手がかりに基づいて複雑なタスクを実行できる、マルチモーダルな具体化された人工知能システム。マスク氏は2021年から人型ロボットの可能性を強調し、「ロボット人工知能」の幅広い展望を揺るぎなく提案してきた。 AIGC(生成型AI)が熱い中、タイミングよく「身体化知能」という言葉が普及し、「ロボットAI」が再び表舞台に押し上げられました。今日のA株流通市場に反映され、関連銘柄は大幅に上昇し、多くの銘柄が1日の上限に達しました。引け時点では、MOONS Electric、Youde Precision、OBI Zhongguangが日足のストップ高となっている一方、Robotics、ArcSoft Technology、Yuntian Lifei、Haozhi Electromechanical、Eftなどが10%以上上昇した。
AIGC、身体化知能、ロボット、この 3 つはどのように結びついていますか?
テスラ ヒューマノイド ロボット≈身体化知能ロボット
マスクの人型ロボットについては、人々はすでによく知っています。最終用途の観点から見ると、テスラの人型ロボットと身体化された知的ロボットはほぼ同等です。
マスク氏のテスラロボットに関する長期目標は、ロボットが環境に適応して人間と同じことをできるようにして、料理、芝刈り、高齢者の世話など、何千もの家庭でサービスを提供できるようにすることです。身体化インテリジェント ロボットは、物理的な実体を持ち、現実世界とマルチモーダルに対話し、人間と同じように環境を認識して理解し、自律学習を通じてタスクを完了できるインテリジェント エージェントです。 NVIDIA のロボット研究シニア ディレクターでワシントン大学教授のディーター フォックス氏は以前、ロボット研究の重要な目標は現実世界で人間に役立つロボットを構築することであると指摘しました。
AIGC は、技術的なボトルネックを突破するための身体化インテリジェンスの新しいアイデアを提供します
身体化された知能は知能科学の基本的な問題であり、大きな問題です。 AIGC は、身体化されたインテリジェンスを実現するための新しいアイデアを提供します。
1950 年、チューリングは論文「コンピューティング機械とインテリジェンス」の中で身体化インテリジェンスの概念を初めて提案しました。今後数十年間、物理的知能は技術的な制約により大きな進歩を遂げませんでした。
スタンフォード大学のコンピューター サイエンス教授であるリー フェイフェイ氏は次のように述べています。 「
人間や環境とのインタラクションは、身体化されたインテリジェント ロボットが客観的な世界を理解し、変換する能力を開発するための最初のステップです。この点で、最も直接的な障害は、人々が手書きのコードに大きく依存していることです。制御ロボット「バベルの塔」が人間と人工知能の前にそびえ立つ。
AIGC の時代では、GPT などの大規模 AI モデルが新しいソリューションを提供してきました。多くの研究者が、人間とロボット間のコミュニケーションの橋渡しとしてマルチモーダル大規模言語モデルを使用しようと試みてきました。つまり、画像、テキスト、具現化されたデータを共同でトレーニングし、マルチモーダル入力を導入することで、モデルによる現実のオブジェクトの理解を強化し、ロボットが具現化された推論タスクを処理できるようにすることができます。
Microsoft、Google、Alibaba などが積極的に検討中です
現在、身体性インテリジェンスは国際的な学術フロンティア研究の方向性となっており、米国国立科学財団などの機関が身体性インテリジェンスの開発を推進しており、主要な国際学会でも身体性インテリジェンスにますます注目が集まり始めています。インテリジェンス関連の研究については、米国の一流大学が具体的なインテリジェンス研究コミュニティを形成し始めています。業界も急速に進歩しており、Google と Microsoft が主導権を握り、両社とも大型モデルのロボットに魂を注入しようとしています。前者の PaLM-E モデルは、身体化された知能と切り離すことができません。身体化されたロボットのタスクを完了することが、常にこのモデルの研究の焦点でした。後者は、OpenA によって開発された ChatGPT をロボット工学の分野に拡張する方法を模索しています。言語を備えた機械などの制御機械、武器、ドローン、家庭支援ロボット、その他のプラットフォーム。
中国では、 アリババも Qianwen 大型モデルを産業用ロボットに接続する実験を行っています DingTalk ダイアログ ボックスに人間の言葉で文章を入力することで、ロボットに遠隔から動作を命令することができます。
投資の主軸がますます明確になりました技術的な観点から見ると、身体化されたインテリジェンスの実現は、知覚、想像力、実行という 3 つの主要なリンクから切り離すことができません。具体的には、具現化された知能ロボットを実現するためには、柔軟な思考力、強力な実行力、人との優れたコミュニケーション能力、そして人間らしい自己学習能力が必要となります。
強力な実行は、ロボットの物理的な周辺機器、つまり機械本体と基本的な動作制御に依存します。知覚と想像力は、ロボットの聞く、見る、話す能力に外部化できます。マシンの使用 ビジョン、ディープラーニング、強化学習などのさまざまな AI テクノロジーは、ソフトウェアとアルゴリズムを最適化し、テキスト、ビジョン、音声、トレーニング用のシーンなど、さまざまな環境にわたる多数のデータセットを使用します。
多くの機関は、ロボット産業、マルチモーダル大型モデル、マシンビジョンテクノロジーが新たな収益の方向性であると信じています。国盛証券は、「マルチモーダル GPT はロボット産業の発展に大きく貢献できる。今後 5 ~ 10 年で、複雑なマルチモーダル ソリューションと組み合わせた大型モデルは、世界と対話し、さまざまな分野で応用できる完全な機能を備えるようになることが期待される」と述べた。一般ロボットなどの分野; 天豊国際証券は、AIはマシンビジョンの母であり、ディープラーニングはマシンビジョンの技術的要塞であると述べました。メタによるSAMモデルの最近のリリースは、マシンビジョンがGPTの瞬間を迎えるのに役立つと期待されています。
上記の業界またはそれに対応するテクノロジーを持つ企業が注目を集めています。 Interactive Yishang、Lingyunguang、Huichuan Technology、Haitian Ruixiang などの上場企業はいずれも、具現化されたインテリジェンスとの関連について投資家から疑問視されています。その中で、凌雲光は、マルチモーダル融合技術を使用して複数のシナリオで顧客のインテリジェント製造ニーズを解決しており、これは身体化インテリジェンスの開発に必要なステップであると明確に回答した数少ない企業の1つです。 Science and Technology Innovation Board Daily による不完全なレビューによると、機関研究レポートと組み合わせると、次の企業も注目を集めています:
出典: Science and Technology Innovation Board Daily
以上がAIGC+ロボット=身体化された知能?シリコンバレーで最もクールな 2 人が偶然共演し、A 株が「次の波」を予感させるの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

ホットAIツール

Undresser.AI Undress
リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover
写真から衣服を削除するオンライン AI ツール。

Undress AI Tool
脱衣画像を無料で

Clothoff.io
AI衣類リムーバー

Video Face Swap
完全無料の AI 顔交換ツールを使用して、あらゆるビデオの顔を簡単に交換できます。

人気の記事

ホットツール

メモ帳++7.3.1
使いやすく無料のコードエディター

SublimeText3 中国語版
中国語版、とても使いやすい

ゼンドスタジオ 13.0.1
強力な PHP 統合開発環境

ドリームウィーバー CS6
ビジュアル Web 開発ツール

SublimeText3 Mac版
神レベルのコード編集ソフト(SublimeText3)

ホットトピック











この記事では、トップAIアートジェネレーターをレビューし、その機能、創造的なプロジェクトへの適合性、価値について説明します。 Midjourneyを専門家にとって最高の価値として強調し、高品質でカスタマイズ可能なアートにDall-E 2を推奨しています。

メタのラマ3.2:マルチモーダルとモバイルAIの前進 メタは最近、ラマ3.2を発表しました。これは、モバイルデバイス向けに最適化された強力なビジョン機能と軽量テキストモデルを特徴とするAIの大幅な進歩です。 成功に基づいてo

この記事では、ChatGpt、Gemini、ClaudeなどのトップAIチャットボットを比較し、自然言語の処理と信頼性における独自の機能、カスタマイズオプション、パフォーマンスに焦点を当てています。

ねえ、忍者をコーディング!その日はどのようなコーディング関連のタスクを計画していますか?このブログにさらに飛び込む前に、コーディング関連のすべての問題について考えてほしいです。 終わり? - &#8217を見てみましょう

この記事では、Grammarly、Jasper、Copy.ai、Writesonic、RytrなどのトップAIライティングアシスタントについて説明し、コンテンツ作成のためのユニークな機能に焦点を当てています。 JasperがSEOの最適化に優れているのに対し、AIツールはトーンの維持に役立つと主張します

Shopify CEOのTobiLütkeの最近のメモは、AIの能力がすべての従業員にとって基本的な期待であると大胆に宣言し、会社内の重大な文化的変化を示しています。 これはつかの間の傾向ではありません。これは、pに統合された新しい運用パラダイムです

今週のAIの風景:進歩、倫理的考慮、規制の議論の旋風。 Openai、Google、Meta、Microsoftのような主要なプレーヤーは、画期的な新しいモデルからLEの重要な変化まで、アップデートの急流を解き放ちました

この記事では、Google Cloud、Amazon Polly、Microsoft Azure、IBM Watson、DecriptなどのトップAI音声ジェネレーターをレビューし、機能、音声品質、さまざまなニーズへの適合性に焦点を当てています。
