本物の 3D 作成がここにあります。手でジェスチャーする必要があります。今度はAIが私の仕事を奪うことはできないでしょう?
AR の進歩の道を歩みます。今後も業界の新たな役割や技術力が加わり、AR を私たちの究極の想像力、つまり本当の意味での大衆向けの拡張現実に向けて共同で推進していきます。
この記事はAI New Media Qubit(公開アカウントID:QbitAI)の許可を得て転載しておりますので、転載については出典元にご連絡ください。
ARずっと辛辣な内容でした。
過去の期間、AR メーカーは、重量、バッテリー寿命、機能の点で新たな工夫を凝らした消費者向け AR グラスの発売を急いできましたが、批判を逃れることはできません:
映画を見る以外に何ができますか?
現在の消費者向け AR は本当に AR なのでしょうか?
ユーザーにとって、ARグラスの役割が単にプロジェクターをレンズサイズに縮小して目の前に置くことだけでは、現代において新たに生まれつつある消費者のニーズに応えることは困難です。長期。
携帯電話からコンテンツ エコシステムを借りていますか?
それは望ましくないように思えますが、結局のところ、AR の最大の想像力は、どのようにして新しい独立した端末となるかにかかっています。さらに、携帯電話のコンテンツは 2D に限定されており、拡張現実の基本的な定義で繰り返し言及されている 3D とは根本的に異なります。 ######だから何をすべきか?
独自の空売り
60,000 ユニットAR メガネ在庫業界の大手企業は最近、メタバースの引き潮に対して解答用紙を放棄しました: AR アプリケーションを通じて、一般の人でも 10 分で自分だけの AR デジタル空間を構築できます。
そしてやはり手作業で物理空間に作成する必要があるのですが、今回はAIが何も言うことはないのでしょうか? もちろんこれは冗談で、その背後にある本当の目的は、
より多くの開発者やクリエイターが AR 空間で想像力を発揮できるようにし、AR コンテンツ エコシステムを拡大できるようにすることです、そして、 ARの公共レベルへの普及。
それでは、このアプリは一体何なのでしょうか?このような野心的な目標を独力で達成できるでしょうか?舞台裏で明らかになったAR業界の底流とは? 霊的領域とは何ですか?
Rokid の創設者兼 CEO の Zhu Mingming 氏は、Lingjing は誰もが AR デジタル コンテンツの作成に参加できる、AR 業界における画期的な製品であると述べました。
正式な定義は、
Lingjing は AR 空間作成ツールで、できることは 3D 空間上に AR コンテンツを作成することであり、非常に敷居が低く誰でも利用できます。
具体的な操作手順は 5 つのステップに分かれています。
携帯電話で空間をスキャンクラウド空間の再構築- オンライン シーンのレイアウト
- マルチ端末のワンクリックリリース
- AR 端末体験
- # つまり、Lingjing は通常の携帯電話のカメラを通じて空間情報を取得し、それを再構成することができます。クラウド。あとは自分のアイデアに従って作品を完成させましょう。
#作成した AR コンテンツはプラットフォーム上で直接公開でき、複数の人が 1 つのスペースで作品を公開できます。最後に、AR メガネを装着するだけで体験できます。
全工程を終えると、約10平方メートルのスペースがわずか10分
レポートによると、Lingjing のコンテンツ レンダリングも Rokid 独自の 3D レンダリング エンジンに基づいており、コンテンツの作成と実装全体にかかる時間と人件費を大幅に削減できます。
AR コンテンツ作成の現在の実装プロセスは、基本的に依然として長い連鎖プロセスであることを知っておく必要があります。
協力
という大きな特徴も強調されています。 携帯電話でもPCでもARグラスでもクリエイティブなコンテンツ空間が見られるという多端末整合性を実現するだけでなく、同じ空間で複数の人がAR制作に参加することも可能になります。
このポジショニングの方が明らかに一般的です。業界のユーザーや一般の消費者がそれを始めて体験することができます。同時に、いくつかの新しい要件も提示されます。高い同時実行性の要件、端末のコンピューティング能力、コンテンツ作成効果など。
次に質問が来ます -
の包括的なアップグレードがあります。
まずハードウェアを見てみましょう。今回、Lingjing のリリースに合わせて、Rokid は AR グラスを従来の「ダブル魚眼 RGB 3 カメラ ソリューション」から「
シングルカメラ RGB ソリューション」にアップグレードしました。軽量SLAM」。 単眼ソリューションの利点は非常に直接的です。シンプルな構造、ハードウェア設計の複雑さの軽減、小さなマザーボード面積、コスト対電力比の大幅な削減、そしてユーザーは装着感とバッテリー寿命の向上を直接感じることができます。 着陸アプリケーションに関しては、Lingjing を搭載したハードウェアには カメラが 1 台しか搭載されていないと報告されています。 カメラの数が最後の 1 つに圧縮されるため、単眼ソリューションは 低消費電力、シンプルな構造、低コストなどの多くの利点をもたらします。ウェアラブルでより手頃な価格は、「AR をより包括的にする」という Lingjing の要求と一致しています。 しかし、単眼ソリューションには欠点があります。たとえば、絶対的なスケール情報を取得できないため、初期化を通じてスケール情報を復元する必要があり、初期化の品質はアルゴリズムの最終的な精度に直接影響します。単眼計算の絶対スケール精度は十分に高くなく、スケール収束にも不確実性があり、これらは単眼 SLAM アルゴリズムの開発に大きな課題をもたらし、AR 体験に直接影響します。 ただし、Rokid 氏は、対応するソリューションがすでに業界に登場していると述べました。 アルゴリズム的には、IMU の支援により、単一目的の静的初期化と動的初期化のための多くのソリューションがあり、初期化が完了すると、基本的にはより正確な絶対スケール事前分布が取得されます。たとえば、フィルタリングに基づくアルゴリズムと組み合わせることで、後の使用プロセスでさまざまな SLAM パラメータを継続的に最適化し、アルゴリズムの測位精度をさらに向上させることができます。テクノロジー。 このことから、Rokid の哲学は次のようなものであることも感じられます。AR 製品は、単に積み重ねられたセンサーではなく、ソフトウェア、ハードウェア、アルゴリズム、シナリオ全体であり、より快適で包括的な AR 体験をユーザーに提供するものです。 ソフトウェアの改善は主に 3D 点群と SLAM に反映されています。 また、デバイスとクラウドのコラボレーションを使用して、コンピューティング能力、消費電力、および高い同時実行性の要件のバランスをとります。 Rokid アプリケーション プラットフォーム センター部門マネージャー Watson が紹介した: 3D 点群とデバイス側 SLAM テクノロジーに基づく視覚測位テクノロジー (同時位置特定とマッピング、同期測位とこれは、自動運転における高精度の道路地図や車両空間認識と比較できます。 AR シナリオでは、一部の開発者はグローバルな大まかな位置決めに点群を使用し、ローカルな正確な位置決めに SLAM を使用しており、この 2 つは緩やかに結合されています。 今回の Rokid はこれを疎結合にし、より深い統合を行いました。端末上では測位と追跡のみを実現し、クラウド上では空間マッピングを実現します。 このデバイスとクラウドの協調コンピューティング手法により、テクスチャが弱いシーンや環境の変化など、一部のシナリオでの測位精度が向上し、モバイル端末のコンピューティング能力も削減できます。原理的には主にRTC(リアルタイム通信)の弱ネットワーク対抗・低遅延伝送や映像圧縮の利点を活かします。 密結合の実装は、Rokid の新しくアップグレードされた基盤となるオペレーティング システム YodaOS-Master に依存しています。 具体的な変更は、XR システム、XR クラウド サービス、XR ハードウェアの 3 つのレベルに反映されます。 # システムが完全にアップグレードされた後、Rokid はより完全な閉ループ OS エコシステムを構築して、開発者と消費者をより適切に結び付けることができます。 Lingjing のテクノロジー スタックを詳しく調べてみると、Rokid がこのリリースに向けて十分な準備ができていることがわかります。 中心的な目的は非常に明確です。AR コンテンツ作成の敷居を下げ、AR コンテンツ作成チームを強化することです。 携帯電話さえあれば体験でき、時間も10分と短縮されており、まさに誰もが満たせる条件であり、いわゆる「体験」を体感する機会でもあります。 「リアルAR」みたいな。考えてみてください、それは確かに好奇心旺盛な人々の波を引き寄せる可能性があります。 これも人々の興味を引くものですが、なぜこの時点でスピリチュアルな領域が正式に発足したのでしょうか?そして、なぜ閾値を下げることに重点を置く必要があるのでしょうか? その答えは、市場の需要、AR 業界の発展、業界関係者の経験の検証によって決まります。 最も直接的な影響を与える要因は、市場の需要です。 Rokid の副社長でデジタル カルチャー部門の責任者である Chen Xi 氏は、現在、文化ブログと文化観光の分野では、AR コンテンツの需要が非常に顕著であると述べ、それを説明するための素晴らしいデータを示しました。 : 今年の春節期間中に文化博物館シーンで Rokid AR を体験した人の数は 40,000 に達しました。 広東省博物館、西安博物館、陝西自然史博物館、蘇州博物館、良渚古城遺産公園など、全国各地でARガイドが相次いで導入されている。 AR が文化や博物館の分野に急速に参入する理由も簡単に理解でき、3D 空間のコンテンツを大幅に充実させ、文化知識をより直観的、豊かで多様な方法で一般の人々に提示できます。訪問者の前で。 全国の登録博物館数は6,000を超え、要望を出す博物館が増えるにつれ、これまでのロングチェーンコンテンツ制作モデルでは迅速な対応が困難でした。さらに、この計画ベースの実装モデルでは、人的コストと物的コストに関しても高い要件が課せられます。 したがって、市場では、AR コンテンツの作成を加速し、コストを削減できる、効率的で使いやすい生産性ツールが緊急に必要とされています。 一方、業界でも同様の状況です。 Rokid 副社長兼製品技術センター所長 Jiang Tao 氏は、これは文化博物館のシーンに似ていると述べ、工業生産の最前線でも同様の展示を期待していると述べました。 3D空間上で可能な限り情報を提供します。 これにより、第一線の担当者が作業中にデータを見たり状況を確認したりするために機器の前に行く必要がなくなり、必要な情報を現場で直接確認できるようになります。 Jiang Tao氏の言葉を借りると、産業メタバースという大きな概念から出発して、デジタルトランスフォーメーションを完了するということは、産業メタバースのインフラが完成することを意味し、そうして初めて統合・分析されたデータが現場にフィードバックされることになるのです。旅は本当に終わるのか、閉ループ全体。 産業シナリオでは当然、コスト削減と効率向上に対するより高い要件が提示されるため、産業シナリオにおける AR の需要と市場はさらに大きくなる可能性があります。 多くの工場では、実際の AR 生産ラインが多数設置されています。 さらに、教育分野 では、 ARを活用した授業支援も徐々に普及してきています。 たとえば、AR ベースのセキュリティ教育は、もはや書面やビデオ形式での単なる教化ではありません。子どもたちは模擬火災現場で逃げる方法を学ぶことができ、記憶点がより深くなり、教育効果が自然に良くなります。 このシナリオでは、学校の教師はコースの要件に基づいて AR コンテンツを継続的に更新する必要があることがよくありますが、携帯電話で使用できる敷居の低いコンテンツ制作ツールが実際のニーズを満たしています。 上記は市場からもたらされる直接的な需要です。 AR の現在の進化には、より深い影響を与える要因が必要です。 AR ネイティブ コンテンツ エコロジーの欠如については常に不満が指摘されており、これが多くの人が AR デバイスを体験したくない主な理由となっています。 携帯電話からエコロジーを借用しますか?短期的にはコンテンツの豊富さは増加しましたが、表示されるコンテンツは 2D レベルに限定され、実際の AR コンテンツは表示されていません。AR メガネの終焉は携帯電話のアクセサリであると人々に思わせるでしょうか? したがって、AR 業界では、コンテンツ エコシステムを充実させることが現在の開発の最優先事項であることをほぼ全員が認識しています。たとえば、Apple は初期の AR を研究していたときに、AR Kit 開発プラットフォームを最初にリリースし、AR 分野で APP Store スタイルを使用し続けました。 結局のところ、コンテンツが豊富な場合にのみユーザーが引き付けられ、AR が前進するチャンスが得られます。したがって、現在の問題は、AR ネイティブ コンテンツをどのように充実させるかということになります。 AR メーカー単独の効率性が十分に高くないことは明らかであり、過去数年間に検討された AR インタラクション シナリオは依然として非常に限られています。 より多くの開発者やクリエイターに参加を呼びかけることが業界のコンセンサスとなりつつあり、使用の障壁とコストを下げる必要があります。 業界の上級プレイヤーとして、Rokid が Lingjing のような AR 空間エンジンの立ち上げを選択したことを理解するのは難しくありません。 しかし、なぜ今なのでしょうか? Rokid の答えは次のとおりです。文化および博物館分野での独自の経験の蓄積により、AR に対する市場の本当の需要が証明されました。 陳熙さんは、初めて良渚古城遺産公園に協力したときの、今でも鮮明に頭の中に残っているさまざまな光景を思い出しました。 彼女は、Rokid と公園が文化遺物の修復に AR を使用できないかと提案したとき、公園がすぐに関心を示したことを思い出しました。プロジェクト全体は最初の提案から実施まで約 3 か月かかり、最終的に 2020 年の国慶節に一般公開されました。 Rokid では当初、1 日あたり 200 組の AR グラスをレンタルしていましたが、結果として 1 時間程度ですべての機器が貸し出されるようになりました。そして、AR に興味を持っている人の多くは高齢者や子供であり、これは Rokid 氏の予想を超えています。 実際のシナリオを適用することで、実際に現場から非常に貴重な 開発経験 を蓄積することができます。たとえば、人々はツアーの順序に従って訪問することが想定されていますが、実際にはそうではなく、順序を外して訪問しても AR 効果の表示に影響を与えないように Rokid は保証する必要があります。博物館の室内照明条件の悪さに対応して、技術チームは特別な最適化も行いました...最終的に、これらの最適化と反復は精神的領域の設計に反映されました。 Chen Xi 氏はまた、AR を体験するために特別なデバイスを購入するために誰もが数千元を費やすわけではないことは否定できないと感情を込めて述べました。誰もが喜んで を試してみます。 AR ネイティブ コンテンツ生産性ツールとしての Lingjing の登場は、業界内外に次のようなシグナルを送ります。 AR コンテンツ エコシステムを開発する時期が来ています。 そして、それはもはや携帯電話や他の端末からエコロジーを借用するのではなく、AR そのものから出発して「本当の AR とは何か」を示しています。 一方、モバイル コンピューティング端末の現在の絶対的な優位性であるスマートフォンを参照してください。これは、人気のあるコンテンツ アプリケーションの出現直後に、すぐに多くのユーザーを魅了しました。 一方で、ARネイティブコンテンツと携帯電話などの端末コンテンツには根本的な違いがあり、それは3Dである必要があります。 携帯電話からエコロジーを借用し続けると、AR に対する一般の人々の理解は携帯電話の仮想的な大画面のみになる可能性があり、技術と産業全体の発展の想像力を制限するだけでなく、 AR の独自開発に影響を与えます。 したがって、AR ネイティブ コンテンツの開発は、今行わなければならないことです。 現在、AR コンテンツはコンピューティング能力、ハードウェア、その他の条件によって制限されていますが、まだすべての人の最終的な期待に応えることはできません。しかし、Windows の初期と同じように、マインスイーパーやスパイダー ソリティアのような単純なアプリケーションしかなかったのではありませんか? 私たちはテクノロジーに十分な忍耐力を与え、変化が起こるのを待つ必要があります。 さらに、デバイスとクラウドを統合するというアイデアは、現在のコンピューティング能力の問題に対する新しい解決策を提供します。 AR 業界以外の視点から見ると、スピリチュアルな領域の出現は、開発者やクリエイターにとって新たな機会も提供します。結局のところ、各世代のモバイル コンピューティング端末の台頭には、多数の優れたコンテンツ アプリケーションやソフトウェアの出現が伴います。 つまり、AR で前進中です。今後も業界の新たな役割や技術力が加わり、AR を私たちの究極の想像力、つまり本当の意味での大衆向けの拡張現実に向けて共同で推進していきます。 ######どう思いますか? なぜスピリチュアルな領域をやりたいのですか?
霊的領域は何をもたらすのでしょうか?
以上が本物の 3D 作成がここにあります。手でジェスチャーする必要があります。今度はAIが私の仕事を奪うことはできないでしょう?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

ホットAIツール

Undresser.AI Undress
リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover
写真から衣服を削除するオンライン AI ツール。

Undress AI Tool
脱衣画像を無料で

Clothoff.io
AI衣類リムーバー

AI Hentai Generator
AIヘンタイを無料で生成します。

人気の記事

ホットツール

メモ帳++7.3.1
使いやすく無料のコードエディター

SublimeText3 中国語版
中国語版、とても使いやすい

ゼンドスタジオ 13.0.1
強力な PHP 統合開発環境

ドリームウィーバー CS6
ビジュアル Web 開発ツール

SublimeText3 Mac版
神レベルのコード編集ソフト(SublimeText3)

ホットトピック











上記と著者の個人的な理解 3 次元ガウシアンプラッティング (3DGS) は、近年、明示的な放射線フィールドとコンピューター グラフィックスの分野で出現した革新的なテクノロジーです。この革新的な方法は、数百万の 3D ガウスを使用することを特徴とし、主に暗黙的な座標ベースのモデルを使用して空間座標をピクセル値にマッピングする神経放射線場 (NeRF) 方法とは大きく異なります。明示的なシーン表現と微分可能なレンダリング アルゴリズムにより、3DGS はリアルタイム レンダリング機能を保証するだけでなく、前例のないレベルの制御とシーン編集も導入します。これにより、3DGS は、次世代の 3D 再構築と表現にとって大きな変革をもたらす可能性のあるものとして位置付けられます。この目的を達成するために、私たちは 3DGS 分野における最新の開発と懸念について初めて体系的な概要を提供します。

特に Teams ユーザーの場合は、Microsoft が仕事中心のビデオ会議アプリに 3DFluent 絵文字の新しいバッチを追加したことを覚えておく必要があります。 Microsoft が昨年 Teams と Windows 向けの 3D 絵文字を発表した後、その過程で実際に 1,800 を超える既存の絵文字がプラットフォーム用に更新されました。この大きなアイデアと Teams 用の 3DFluent 絵文字アップデートの開始は、公式ブログ投稿を通じて最初に宣伝されました。 Teams の最新アップデートでアプリに FluentEmojis が追加 Microsoft は、更新された 1,800 個の絵文字を毎日利用できるようになると発表

上記および筆者の個人的な理解: 現在、自動運転システム全体において、認識モジュールが重要な役割を果たしている。道路を走行する自動運転車は、認識モジュールを通じてのみ正確な認識結果を得ることができる。下流の規制および制御モジュール自動運転システムでは、タイムリーかつ正確な判断と行動決定が行われます。現在、自動運転機能を備えた自動車には通常、サラウンドビューカメラセンサー、ライダーセンサー、ミリ波レーダーセンサーなどのさまざまなデータ情報センサーが搭載されており、さまざまなモダリティで情報を収集して正確な認識タスクを実現しています。純粋な視覚に基づく BEV 認識アルゴリズムは、ハードウェア コストが低く導入が容易であるため、業界で好まれており、その出力結果はさまざまな下流タスクに簡単に適用できます。

0.前面に書かれています&& 自動運転システムは、さまざまなセンサー (カメラ、ライダー、レーダーなど) を使用して周囲の環境を認識し、アルゴリズムとモデルを使用することにより、高度な知覚、意思決定、および制御テクノロジーに依存しているという個人的な理解リアルタイムの分析と意思決定に。これにより、車両は道路標識の認識、他の車両の検出と追跡、歩行者の行動の予測などを行うことで、安全な運行と複雑な交通環境への適応が可能となり、現在広く注目を集めており、将来の交通分野における重要な開発分野と考えられています。 。 1つ。しかし、自動運転を難しくしているのは、周囲で何が起こっているかを車に理解させる方法を見つけることです。これには、自動運転システムの 3 次元物体検出アルゴリズムが、周囲環境にある物体 (位置を含む) を正確に認識し、記述することができる必要があります。

新しい Windows 11 が開発中であるというゴシップが広まり始めたとき、すべての Microsoft ユーザーは、新しいオペレーティング システムがどのようなもので、何をもたらすのかに興味を持ちました。憶測を経て、Windows 11が登場しました。オペレーティング システムには新しい設計と機能の変更が加えられています。いくつかの追加に加えて、機能の非推奨と削除が行われます。 Windows 11 に存在しない機能の 1 つは Paint3D です。描画、落書き、落書きに適したクラシックなペイントは引き続き提供していますが、3D クリエイターに最適な追加機能を提供する Paint3D は廃止されています。追加機能をお探しの場合は、最高の 3D デザイン ソフトウェアとして Autodesk Maya をお勧めします。のように

ChatGPT は AI 業界に鶏の血を注入し、かつては考えられなかったすべてのことが今日では基本的な慣行になりました。進化を続ける Text-to-3D は、AIGC 分野において Diffusion(画像)、GPT(テキスト)に次ぐホットスポットとされ、前例のない注目を集めています。いいえ、ChatAvatar と呼ばれる製品が控えめなパブリック ベータ版として公開され、すぐに 700,000 回を超えるビューと注目を集め、Spacesoftheweek で特集されました。 △ChatAvatarは、AIが生成した単一視点/多視点の原画から3Dの様式化されたキャラクターを生成するImageto3D技術にも対応しており、現在のベータ版で生成された3Dモデルは広く注目を集めています。

自動運転アプリケーションの場合、最終的には 3D シーンを認識することが必要になります。理由は簡単で、車両は画像から得られる知覚結果に基づいて運転することはできませんし、人間のドライバーであっても画像に基づいて運転することはできません。物体までの距離やシーンの奥行き情報は2D認識結果に反映できないため、自動運転システムが周囲の環境を正しく判断するための鍵となります。一般に、自動運転車の視覚センサー(カメラなど)は、車体上部または車内のバックミラーに設置されます。どこにいても、カメラが取得するのは、現実世界を透視図 (PerspectiveView) (世界座標系から画像座標系) に投影したものです。この視点は人間の視覚システムに非常に似ており、

前に書かれたプロジェクトのリンク: https://nianticlabs.github.io/mickey/ 2 枚の写真が与えられた場合、それらの写真間の対応関係を確立することで、それらの間のカメラのポーズを推定できます。通常、これらの対応は 2D 対 2D であり、推定されたポーズはスケール不定です。いつでもどこでもインスタント拡張現実などの一部のアプリケーションでは、スケール メトリクスの姿勢推定が必要なため、スケールを回復するために外部深度推定器に依存します。この論文では、3D カメラ空間でのメトリックの対応を予測できるキーポイント マッチング プロセスである MicKey を提案します。画像全体の 3D 座標マッチングを学習することで、相対的なメトリックを推測できるようになります。
