利益の余地はどこにあるのでしょうか?

ホームページ

テクノロジー周辺機器

Apple のヘッドセットが登場、AI 仮想人間の救世主か、それとも隕石か?

王林

Jun 11, 2023 am 11:16 AM

アップルのヘッドセット AI仮想人間セイヴァーメテオ

著者|蘇暁瑠

Apple のヘッドセットが登場、AI 仮想人間の救世主か、それとも隕石か?

AIGC は非常に人気がありますが、メタバースは忘れられてしまったのでしょうか?

Apple の新しい AR メガネ Vision Pro (価格 24,000 元) のリリースにより、しばらく休眠状態にあった AR と VR が再び注目の的となっています。

AR と VR の準備を最初に行い、再び興奮するのは誰ですか?もちろん、バーチャルピープルやデジタルピープルを作っている一連の会社です。バーチャルヒューマン技術は、エンターテインメントと非常に密接に融合した技術です。初期のメタバースの概念と現在の AIGC 時代では、バーチャルヒューマンにはホットスポットと統合できる場所が数多くあります。

AIGC構想と合わせて、今年上半期の業界最大のテーマとなる。今月初めには、ネット有名人「フォレスト・ハンゾー」のデジタルクローンが公開され、ユーザーは月単位や年単位で音声や通話などのサービスを楽しめるようになる。 AI が人間のドライバーに取って代わるため、デジタルヒューマンは 24 時間 365 日働くことができ、生産能力が大幅に向上します。

ここで説明するライブブロードキャストプロセスは、現実の人々、つまり仮想人物の「伝統的なジャンル」の 1 つである「中間の人々」のパフォーマンスによって駆動されます。完全にプログラムまたは AI によって駆動される人工知能の継続的な進化に伴い、適応ベースで質問と回答を提供することが、バーチャルヒューマン産業のもう 1 つの主要な発展方向となっています。

AI バーチャルヒューマンを実現するための技術的ルートは、現在 2 つのタイプに分かれています。1 つは大規模なモデルを民営化して展開する方法、もう 1 つは既存のオープンソースモデルに基づいてターゲットを絞った二次開発を行う方法です。

Apple のヘッドセットが登場、AI 仮想人間の救世主か、それとも隕石か? 表 1 この記事でインタビューしたバーチャルヒューマン企業 3 社のタイプ分類集計/エンターテイメントキャピタリズム

この記事では、Entertainment Capitalism が 3 人の典型的なバーチャルヒューマンテクノロジー開発者を紹介し、AI が製品開発とビジネスモデルにもたらした変化を探ります。

AIGC バーチャルコンテンツプラットフォーム Yunbo は、ライブ配信者向けの「Little K Live Broadcaster」をキャリアとして使用し、ゲーム的な方法でディープなライブブロードキャストエコシステムを探索および構築します。

Zhongke Shenzhi は、エンドツーエンドの生成 AI バーチャルヒューマンテクノロジーに焦点を当てており、販売業者向けの商品の「自動ブロードキャスト」に焦点を当てており、バーチャルヒューマンの質疑応答の効果を大幅に向上させる独自の大型モデルをリリースしました。交流; ＃＃＃

クロスモーダルインテリジェントソフトウェアサービス会社 Mejike は、企業に完全自動の仮想アンカーを提供するだけでなく、企業の内部データを使用して独自のモデルをトレーニングし、企業の内部データベースと検索エンジンを育成します。

Apple のヘッドセットが登場、AI 仮想人間の救世主か、それとも隕石か?

AIGC を開く 4 つの方法

ステーション B の生放送の多くのアンカーや視聴者は、Xiao K Live Broadcast Ji に馴染みがないでしょう。 Xiao K Live Ji は、RGB カメラを使用して 2D 画像のアクションデータを収集し、アルゴリズムを使用して 3D アクションデータを生成することで、技術的な堀を形成します。ユーザーは、Xiao K Live Broadcast Ji を直接使用して、独自のライブブロードキャスト仮想人物を作成できます。

「基礎となるアルゴリズムを構築し、プライベートトレーニングデータセットを用意するのに 3 年かかりました。そして、この製品は初期の結果を達成しました。」

2017 年、メイソンは Linekong Interactive Game のプロデューサーの職を辞し、人工知能業界に参入し、Xiao K Live Ji の開発者である Yunbo Technology を設立しました。ゲーム業界と AI 業界という二重の背景も、ユンボのビジネスモデルを非常にユニークなものにしています。

Entertainment Capital による AI マッピング

Apple のヘッドセットが登場、AI 仮想人間の救世主か、それとも隕石か? 「当社の事業範囲は、ToB と ToC の両方をカバーしています。製品には、Xiao K AI モーションキャプチャ、AI 描画、バーチャルヒューマンエンジンなどが含まれます。また、自主運営の MCN ギルドとアンカーベースもあります。また、同社はまた、電子商取引の 3 つの核となるシナリオであるライブブロードキャストとゲームに直面し、企業に仮想人物と仮想コンテンツサービスを提供します。」

Zhongke GenSense は、エンドツーエンドの生成 AI バーチャルヒューマンテクノロジーに注力しており、5 月 10 日に「GenSense Digital Intelligence Jiang Shang」と呼ばれる独自の大型モデルを正式にリリースしました。

「Open AI がトレーニング方法を発表して以来、大規模モデルへの参入の難易度は低くなりました。企業が独自の大規模モデルを構築したいかどうかは、主に大規模モデルの商業スペースによって決まります。」の創設者兼 CEO Zhongke Shenzhi Cheng Wei Zhong氏は言いました。「2020 年の初めに、Transformer に基づいたクロスモーダルトレーニング作業を開始し、データクリーニングの経験もあります。」

「私たちは大規模なモデルを構築するために主に 2 つの側面に焦点を当てています。まず、将来のマルチモーダルトレーニングは大規模な言語モデルに基づくことになり、垂直分野の基礎となるアルゴリズムは大規模なモデルに依存する必要があります。第 2 に、多くの顧客が提案していることです。「民営化された展開です。これは、計算能力を削減する必要があります。他の大きなモデルが接続されている場合、ソースコードとデータセットを取得できなくなります。」

Apple のヘッドセットが登場、AI 仮想人間の救世主か、それとも隕石か?

中科深志の事業範囲には、バーチャル生放送、デジタル従業員などに加え、金融、医療、政府、大企業向けのBサイド民営化展開事業も含まれます。同社のバーチャルヒューマンリアルタイムインタラクションおよび応答システム「Yun Xiaoqi」、Yuanverseの電子商取引およびバーチャルヒューマンライブブロードキャストツール「Treasure Box Auto Broadcast & Virtual Assist Broadcast」、およびAI高速アニメーション生成システム「AutomaticAnimation」』がすべて発売されました。

現在、中科深志の「自動ブロードキャスト」顧客は、天猫、淘宝網、JD.comなどのプラットフォームでAIバーチャルヒューマンを使用しているミドルウエストブランド販売者の70%以上を占めています。彼らは最近、現実の人物と仮想の人物を同時に登場させることができる仮想アシスタント製品を発売しました。

Apple のヘッドセットが登場、AI 仮想人間の救世主か、それとも隕石か?

「私たちの目標は、エンドツーエンドの仮想人間作品を作成することです。ユーザーがテキストを入力すると、それは直接かつ自動的に 3D キャラクターにモデリングされ、アクション表現をリアルタイムで生成してコンテンツ出力を形成できます。 Cheng Weizhong 氏は、企業にフルリンクソリューションを提供する必要があると指摘しました。

Maijike Technology が自らに与えたラベルは「クロスモーダル」です。同社はインテリジェントデジタルアセットとインテリジェント生成の分野に焦点を当てています。その主な製品は、インテリジェントコンテンツ制作、インテリジェントな仮想ライブブロードキャスト、および数千人向けのパーソナライズされたインテリジェンスです。インタラクション、そして最近中関村フォーラムで発表された新製品であるデジタルインテリジェンス宇宙ステーションと同様に、3 次元、リアルタイム、インテリジェンスがそのハイライトです。

創業者兼会長のフー・インナ氏によると、舞池科技は2016年にはAIGC分野に参入し始めたという。

「私たちはデータコーパスの手動調整を使用しませんが、非構造化テクノロジーに基づいてデータを構築します。たとえば、企業内のさまざまなデータドキュメントを階層的に処理し、企業向けのクロスモーダル検索エンジンを構築し、企業向けの検索エンジンを構築することができます。データインテリジェントコンテンツを生成し、簡単に操作できます。」

企業向けに民営化展開を行っている企業は数多くありますが、中小企業が大規模モデルを構築するのは困難です。フー・インナ氏は、彼らの堀はオープンソースの大規模モデルに基づく組み合わせイノベーションにあると信じています。」「アルゴリズムとモデルは並列または直列に適用できます。」の組み合わせ。舞地家テクノロジーの基盤技術は階層型アルゴリズムです。このようなアルゴリズムの組み合わせは、低計算能力を必要とし、低コストかつ高効率で構築できます。小さなリソースに基づいて反復されます。データをサンプリングし、最終的には進化可能なインテリジェンスを形成します。」

Apple のヘッドセットが登場、AI 仮想人間の救世主か、それとも隕石か?

利益の余地はどこにあるのでしょうか?

バーチャルヒューマンライブブロードキャストは、主にエンターテイメントブロードキャスト、ゲームブロードキャスト、および電子商取引ライブブロードキャストの3種類に分類されます。 Yunbo の Mei Song 氏は、「価値の観点から見ると、バーチャルヒューマンは最初の 2 つに適しています。物品を運ぶシナリオの中心は物品です。何かが安い限り、誰かが必ずそれを購入します。何かが高価であれば、それを購入します。」「誰でも販売するのは難しいでしょう。バーチャルピープルライブ配信ではグッズの問題は解決できません。」

「バーチャルライブブロードキャストは、ライブブロードキャスト中にファンと瞬時に交流できない問題を改善できます。ファンはいつでもバーチャルアンカーに報酬を与えたり、着替えたりすることができ、バーチャルライブブロードキャストのコンテンツはよりインタラクティブでリッチになります。」と Mei Song 氏は言いました。「Gao Quality のライブコンテンツには、必ず実際の人々の参加が必要です。」

ステーション B を開くと、Xiao K の「水道水」ユーザーがいたるところで見られます。 Mei Song 氏は、3D 仮想アンカーの分野における Xiao K Live Ji の市場維持率が 90% に達し、ネットワーク全体で 400,000 人以上のアンカーがサービスを提供し、毎日アクティブなブロードキャストを行うアンカーが 5,000 人以上であることを明らかにしました。すべてのモーションキャプチャライブブロードキャストツールの中で、C サイドが完全に無料なのは Xiao K だけです。

「私は、Xiao K Live Ji の製品に依存してお金を請求するつもりはありません。将来的には、この製品を使用して、より多くのアンカーを引きつけて使用してもらいたいと考えています。これらの人々には独自のファンとトラフィックが付いています。後で、宇宙シーンを使用してインタラクティブゲームを作成し、ゲームのインターモーダルモデルと同様にコンテンツトラフィックを収益化できます。」

Mei Song は、バーチャルライブインタラクションは 3 つの段階に分かれると考えています。 1.0 の時代は、実際の人々による毎日の生放送で、ギフトを贈ったり、特殊効果を再生したり、集中砲火を行ったりしていました。 2.0 ファンはライブブロードキャストルームの仮想コンテンツに影響を与えたり、弾幕ギフトを通じてキャラクターを作成したりできますが、コントロールすることはできません。 3.0 はメタバーススペースで、ファンとアンカーがライブブロードキャストで自由に対話でき、ファンは仮想ジョイスティックを持ち、コンサートの開催や PK のプレイなど、完全に独立した制御を行うことができます。今年下半期、ユンボは「メタバース」に似た「リトルK宇宙ステーション」を打ち上げ、第3世代のライブインタラクティブシーンを実装する予定だ。

Maijike Technology の Fu Yingna 氏は、プラットフォームが異なれば、仮想ライブブロードキャストに対するポリシーも異なると考えています。「Douyinはそれを奨励しませんが、Bilibiliはおそらくそれを奨励するでしょう。結局のところ、ユーザーは異なります。将来的には、プラットフォームに別の仮想ライブブロードキャストエリアを設けることができます。結局のところ、視聴者がいるのです。」

一方、「長期的には、仮想の人々が現実の人々に取って代わることは、プラットフォームを悪用しようとしており、プラットフォームの利益を侵害していることになります。彼らは将来的には間違いなく禁止されるでしょう。」Cheng Weizhong、中科の賢人は、以前のデジタル担当者が商品を持ってきたと述べました。Douyin が地元の生活をサポートしたいと考えたため、ライブ放送が人気になりました。

Apple のヘッドセットが登場、AI 仮想人間の救世主か、それとも隕石か?

「将来的には、バーチャルパーソンのライブブロードキャストは、プラットフォームと Win-Win の関係にある必要があります。バーチャルパーソンテクノロジーのサプライヤーは、プラットフォーム、ユーザー、ビジネスが何を必要としているのかを明確に考える必要があります。バーチャルアンカーは推論と分析の能力を備えている必要があります」生身の人間にはない、例えば弾幕の雰囲気が良いか悪いかを瞬時に分析・判断できる、これが人工知能の価値です。」

Apple のヘッドセットが登場、AI 仮想人間の救世主か、それとも隕石か?

AI VR: 未来はなんて素晴らしいのだろう

大規模なモデルについて、Cheng Weizhong 氏は次のように述べています。「ディープ AI のトレーニングには大量のコーパスが必要ですが、これらはすべて OpenAI の既存のアプリケーションシナリオです。さらに重要なのは、ディープ AI テクノロジーがしきい値を突破できる場合、新しいものも利用できるかどうかです。同様に、私たちが構築している大規模モデルも、バーチャルヒューマンの限界突破を目指しており、1 年以内にバーチャルヒューマンシーンのインタラクションが進歩すると予想されます。」

ChatGPT の波に加えて、Cheng Weizhong は Apple Glasses にも注目しています。「Apple の AR メガネが長期的に前進できるかどうかは、技術的に AR と VR を統合できるかどうかだけでなく、より重要なのはビジネスモデル、つまり開発者を引き付けて資金を共有できるかどうかにかかっています。一緒にエコシステムを作りましょう。”

「AR メガネの発展により、コンテンツの表現方法も変わり、3D コンテンツの生成やバーチャルヒューマンを行う企業にも大きなチャンスがもたらされるでしょう。起業家にとっては良い機会です。」

Apple Glasses について語るとき、Mei Song 氏は、VR とメタバースの初期実装シナリオに最適なのはゲームであると考えています。「なぜ VR の普及率とユーザー数が増えないのでしょうか? 根本的な理由は、VR をベースにした優れたコンテンツがないことです。」

Yunbo 氏は、Xiao K Live Broadcast Ji Zhong の 3D アセットの作成に 3,000 万元を投資しました。「一方ではコストがかかります。他方では、Xiao K ビデオエンジンなどの自社開発技術もあります」「6 年かかりました。私たちは独自の堀を築きました。」

「今年下半期には、AI 音楽や AI 音声などの AIGC マルチモーダル変換製品の開発を開始します。Xiao K Live Ji はシングルカメラの全身モーションキャプチャバージョンを発売します。「これらの製品は、ゲームのアニメーション制作プロセスにも統合されます。ユーザーが使用可能なアニメーションデータを生成できるよう支援します。さらに、Little K の絵の電子商取引およびゲーム版も開始されます。」

もちろん、これらの計画には大規模なモデルのサポートも必要であるため、Yunbo はモデルのトレーニングに大量のデータも使用します。同社にはすでに数十人のラベル付けチームがいます。

Fu Yingna 氏は、AR/VR が普及した後の状況を説明するために、アップグレードという用語も使用しました。「インターネットの第 1 世代では、すべての企業が独自の Web サイトを持っていました。第 2 世代のインターネットでは、すべての企業が独自の APP を持っていました。第 3 世代のインターネットは 4 次元の時空体験となり、 3D コンテンツのインテリジェントな生成にアップグレードされ、時間と空間の折りたたみを統合することで、リアルタイムのインテリジェントなインタラクションが可能になります。3D コンテンツは、軽量な方法で H5 形式で出力でき、Web ページ、クライアント、その他の場所に同時に表示できます。 -時間のやり取り。」

Apple のヘッドセットが登場、AI 仮想人間の救世主か、それとも隕石か? まいじけテクノロジーが開発した最新の「デジタルスペースステーション」は、仮想空間上に企業向けの「デジタル名刺」を構築し、現実の時間と空間の制限を超えて、立体的、視覚的、知的に提示することができます。、何千人ものユーザーに 1 対 1 のパーソナライズされたインテリジェントサービスを提供します。このコンテンツ操作は、プライベート展開または SaaS を通じて実現できます。これは、新世代のコンテンツ生産性と没入型エクスペリエンスを構築するための鍵であり、デジタル経済時代における重要なツールおよびプラットフォームでもあります。