2023-07-10 17:20:22 著者:ソン・ジュンイ
2023 年 7 月 6 日から 8 日まで、上海で世界人工知能会議 (WAIC) が開催されます。 Mobvoiは大規模な社内テストモデル「Sequence Monkey」、AIGCアート展示、AIGC製品マトリックス - AI吹き替えアシスタント「Magic Sound Workshop」、AIライティングアシスタント「Wonderful Wen」、AIペイントアシスタント「Yihua」、AIデジタルアバターを導入カンファレンスでは「Wonderful Yuan」とデジタルヒューマンのインタラクティブ大画面ソリューションが披露され、多くの来場者が体験し、大きな反響を呼びました。
私が質問しているのは、生成 AI と音声インタラクション技術を主な事業とする人工知能企業です。 CIC Consulting Industry Report によると、Mobvoi はアジアで最も初期の人工知能企業であり、生成 AI を中心に最大の収益規模を誇り、一般的な大規模モデル能力を備えたアジアでは数少ない企業の 1 つであり、また、AI アプリケーションのリーダーでもあります。アジアにおける AI CoPilot テクノロジーのパイオニアとパイオニア。
Mobvoiは2021年の早い段階で自社開発の汎用大型モデル「UCLAI」を発売しており、2023年には「Sequence Monkey」にバージョンアップした。 Mobvoi は、一般的な大規模モデルのコア機能をサポートとして利用し、パーソナライズされた AI ソリューションを提供することに取り組んでいます。
「Sequence Monkey」: マルチモーダルな一般的な大規模言語モデル
Mobvoi が内部テスト中に検討した大規模モデル「Sequence Monkey」は、マルチモーダル生成機能を備えた汎用大規模言語モデルです。モデルの言語中心の機能システムは、「知識、対話、数学、論理、推論、 「プランニング」の 6 つの次元で、テキスト生成、画像生成、3D コンテンツ生成、言語生成、音声認識などのさまざまなタスクを同時にサポートできます。
「Sequence Monkey」は、企業向けに専用の大型モデルをカスタマイズし、モデルのカスタマイズ、画像のカスタマイズ、サウンドのカスタマイズなどのサービスを提供し、教育、医療、自動車、金融などの分野を強化し、企業向けの専用のコパイロットを作成できます。展示会場では、「シークエンス・モンキー」が賢い金融アシスタント、賢い家庭医、賢い弁護士などの役割を交代で登場し、会場の多くの観客が体験し交流する様子を見せた。
また、インタラクティブな大画面を通じて、高い知性、美しい声、容姿を兼ね備えた「Sequence Monkey」は、インテリジェントハードウェアをキャリアとしてデジタルヒューマン3.0時代を切り開きます。
アートとテクノロジーの融合を探るAIGCアート展
「Sequence Monkey」大型モデルに基づいて、Mobvoi は、AI ライティング アシスタント「Qiaowen」、AI ペイント アシスタント「Yiyanhua」、AI など、クリエイター向けの多数の AIGC 製品とアプリケーションを検討しました。吹き替えアシスタント「Moji」「Music Studio」とAIデジタルヒューマンプラットフォーム「Wonderful Yuan」は、クリエイター向けにワンストップのAIGC CoPilot製品マトリックスを構築し、コンテンツ制作プロセス全体をオープンにします。これらの製品とアプリケーションは、AIGC アート展示、モーション キャプチャ デジタル ヒューマン インタラクション、製品インタラクティブ エクスペリエンスを通じて聴衆に公開されました。
Mobvoi の AIGC アート展示エリアは「シンフォニー」をテーマに、ギャラリーエリアは抽象芸術派の「カオス ユニバース」、ロマンチックな想像力に満ちた「イーノス: ソーラー ユートピア」など 5 つのパートで構成されています。 」、印象派芸術と人工知能革命の間の調和のとれた対話の「印象派のささやき」、そしてテクノロジーと芸術の統合の「絡み合った共生」と「知的な夢」。
また、AI モネと AI モンドリアンの 2 人のアーティストが、展示会場でお互いのデジタル ピープルを使い、時空を超えてテクノロジーとアートの対話を行い、アートの魂と意味を深く探求しました。今回展示されたAI絵画はすべてMobvoiのAI絵画製品「Word Painting」によって生成され、モネとモンドリアンのデジタルヒューマンの会話はMobvoiのAIデジタルヒューマン製品「Wonderful Yuan」によって生成されました。
AI ペイント アプリケーション「Yihua」は、テキスト描画、描画描画、制御描画、アバターの生成、ショート ビデオ、GIF などの AI 描画機能を備えています。2K の超鮮明な画質に達し、8 つのスタイル モデルをサポートします。複数のシーンに対応し、高品質な映像作品を簡単に実現できます。また、さまざまな業界や企業の特性に応じた描画ニーズを満たすために、企業向けに専用のカスタマイズされたモデルをサポートしています。
次元の世界を旅する、リアルタイムのモーション キャプチャ インタラクション
今回のQ&A展示エリアでは、モーションキャプチャー体験エリアが人気のエリアとなっており、展示エリア内にある素晴らしいデジタルヒューマンプロダクト「ワンダフルユアン」を体験するために多くの来場者が足を止めています。 Zhongzhiren は、リアルタイムの運転を通じて 3D 仮想画像をその場で踊らせ、デジタル ヒューマンと衣服のマッチング、シーンの切り替え、インタラクティブなゲームプレイなどの機能をデモンストレーションしました。 「中の人」に動かされて大画面上で踊るアバターのダンスは、あまりにもリアルだったので、多くの視聴者が思わず前に出てモーションキャプチャースーツを着て、デジタルアバターを柔軟に動かす楽しさを体験した。
Qiaoyuan は、デジタル画像作成およびライブ ブロードキャスト ソフトウェアであり、何百もの業界顧客にパーソナライズされたデジタル画像カスタマイズ サービスを提供してきました。 「Wonderful Yuan」は、ワンストップのデジタル画像エディターを使用して、「ワン フォト ドライブ」、「2.5D 実在人物クローン作成」、「3D カスタマイズと IP アクティベーション」などのさまざまなデジタル画像クローン ソリューションを提供し、企業がPPT を作成する デジタル ヒューマン ビデオとライブ ブロードキャストを同じように簡単に作成します。
AI の作成とアフレコ、コンテンツ クリエイターのインスピレーション ベース
AI制作やAIアフレコの分野では、Mobvoiも今回の展示会に「ワンダフルテキスト」や「マジックサウンドワークショップ」を出展し、コンテンツ制作を必要とする多くの団体が足を止めて交流を深めた。一部の視聴者は、新しいメディア、クリエイティブライティング、職場などのシナリオで「Qiaowen」のライティング機能を1つずつ体験し、生成効果とインタラクティブインターフェイスの体験が想像を超えていると述べました。
「Qiaowen」は、執筆プロセス中にワンクリックで AI を起動し、柔軟かつ簡潔な編集モードで「続き」「書き直し」「書き直し」をサポートする、さまざまなシナリオや場面での執筆ニーズをサポートする AI 執筆アプリケーションです。 「拡張」 略語、要点抽出、スタイル変換、誤り訂正、翻訳などの 8 つの主要な AI ライティング機能により、コンテンツ作成者がより速く、より適切なコンテンツを作成できるようになり、コンテンツ作成が容易になります。理想的な AI ライティング アシスタントは、画像を自動的に生成し、それをテキストと組み合わせて思考とインスピレーションを刺激し、ライティングで画像とテキストの両方の効果を実現できる必要があります。
「Moyin Workshop(海外版DupDub)」は、コピーライティング、アフレコ、編集を統合した世界有数のワンストップAIソフトウェアです。 「Magic Sound Workshop」は、数千のAIサウンドスタイルを備え、37の言語と15の方言をサポートし、さまざまなビデオ作成やアフレコシーンに適した刻々と変化するスタイルを備えたサウンドストアと、独自の精密なチューニングプラットフォーム「Word Editor for」を搭載しています。サウンド検索、サウンドクローン、TTS「ピンチサウンド」生成など、さまざまな制作方法に対応し、複数人・多端末のチームコラボレーションにも対応しているため、ユーザーはいつでも最適なサウンドを見つけることができます。
将来的にも、Mobvoi は AI テクノロジーの研究開発をさらに掘り下げ、AI をより多くの分野やシナリオに適用し、あらゆる階層のデジタル変革に向けた徹底的なエンパワーメントを提供するよう努めていきます。
以上がMobvoi は 2023 年世界人工知能会議に登場し、AI CoPilot ソリューションを披露しましたの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。