Biaobei Technology のライブ ストリーミング シーン合成データベースは、高品質の「AI アンカー」の作成に役立ちます

WBOY
リリース: 2023-06-08 10:49:32
転載
1024 人が閲覧しました

「こんにちは、ライブブロードキャストルームへようこそ。クリックしてフォローして迷わないように、毎晩ライブブロードキャストの特典があります~」

「618 の福利厚生がここにあります。生放送ルームのファンの皆さん、私たちは 12 時に最初に無料の注文を抽選します~」

ライブ ブロードキャスト ルームに入ると、「バーチャル アンカー」が挨拶をしているのを見ても、驚かないでください。今年、618 プラットフォームは、ライブ ブロードキャスト トラックの「新しいハイライト」を開始することに焦点を当てています。これは、ライブ ブロードキャスト ルームでアンカーとして機能する主要なプラットフォーム上の仮想人材がますます増えている結果です。

标贝科技直播带货场景合成数据库 助力打造优质“AI主播”

実際、注意深く観察しないと、これらのアンカーが AI 仮想アンカーであることを見つけるのは困難です。見た目が本物の人間に似ているだけでなく、声、感情、動きが非常にリアルで、場合によってはダンスや歌など複数の才能を持っていることもあります。

AI により、デジタル担当者はライブ ブロードキャスト配信の次元の壁を突破できるようになります

「Yi Zen Little Monk」、「I Don't Eat for Free」、「Momojiang」などに代表される仮想 IP のライブブロードキャストの予備調査から始まり、AI デジタルヒューマンライブブロードキャストは従来のライブブロードキャストを徐々に変えつつあります。小売業界と電子商取引業界。ますます多くの有名ブランドが、Perfect Diary の「Stella」、Nature Hall の「Tang Xiaomei」、Hua Xizi の「Hua Xiaoxi」、その他のバーチャル アンカーなど、AI バーチャル ヒューマンのライブ ブロードキャストを自社製品のプロモーションに使用しようと試み始めています。

本物のライブ アンカーの高い運用コストと比較して、バーチャル アンカーは時間、場所、環境に制限されず、ワンクリックでブロードキャストを開始でき、24 時間オンラインであるため、ライブ ストリーミングのコストを大幅に削減できます。商人向け。プラットフォームにとって、仮想アンカーは電子商取引プラットフォームのエコロジカルなレイアウトにおいて無視できないリンクであり、ライブブロードキャストのしきい値を継続的に下げることで、プラットフォームは中小規模の販売者にとってより魅力的になります。

「雄弁な」高品質のアンカーを作成するための高品質の合成データセット

AI デジタル担当者が商品を届けるためにライブ ストリーミングを行うことは、すでに一般的な傾向です。しかし、広範な商業化を達成するには、大きな課題にも直面しています。特にバーチャル ヒューマンのハイエンド バージョンの場合、効果がよりリアルになればなるほど、コストも高くなります。

生放送室では、キャスターが主に音声と映像で商品情報を紹介します。その中でも、音は無視できない「第一のメディア」です。第一に、アンカーはユーザーに快適な聞き心地を提供するために、自然で滑らかで感情的な音色を持っている必要がありますが、逆にアンカーの声があまりにも機械的で無関心であると、視聴意欲に影響を与えます。アンカーの音声コントロールなどのインタラクティブな体験 赤い封筒を送り、ファンがボイスチャットでアンカーとコミュニケーションをとることで、生放送室のユーザーとの密着度が高まります。

したがって、より良いライブ ブロードキャストの効果とユーザー エクスペリエンスを実現するために、販売者は仮想アンカーの音声インタラクション機能を継続的にデバッグし、ライブ ブロードキャストのスキルを磨き、ユーザーとの対話機能を改善する必要があります。

どのような機械学習機能であっても、その技術レベルを支えるにはアルゴリズムとデータの蓄積が必要です。ライブ ストリーミング シナリオでの音声対話機能を向上させるには、モデルのトレーニングをサポートするために大量の高品質のライブ ストリーミング シナリオ データが必要です。

Biaobei Technology は、AI データ サービスの分野に長年深く関わっており、データ収集と注釈付けにおいて豊富な実務経験を持っています。生放送配信シナリオのために、Biaobei Technology はプロレベルの録音スタジオと高品質の声優リソースに基づいて高品質の音声合成データベースを慎重に構築し、表音文字注釈、韻注釈、音素境界注釈、口語ラベルを完成させました。データベースのアノテーションなどは、合成された音色がより安定して自然であることを保証するためのアルゴリズムの最適化に直接使用されます。

ライブブロードキャスト配信シナリオに基づく合成データベース

言語: 北京語、中国語、英語の混合

収集環境:プロのレコーディングスタジオ、S/N比35dB以上

データ期間: 中国語で 5 時間、中国語と英語で 1 時間

録音コーパス: アンカーのライブ配信スキル

サンプリング形式:非圧縮PCM WAV形式

サンプリングレート: 48KHz 24bit

アノテーションの内容: 表音文字アノテーション、韻アノテーション、音素境界アノテーション、ストレス、ドラッグ、笑い、その他のラベル アノテーション

対象分野:ライブ配信配信

上記のデータセットに興味のある業界パートナーからのお問い合わせを歓迎します~

上記のデータが現在のニーズを満たせない場合、Biaobei Technology は、特定の人々のグループ、特定のシナリオ、特定の言語に対応するデータ カスタマイズ サービスも提供し、企業顧客が満足のいくデータ サービスを取得できるよう完全に支援します。

以上がBiaobei Technology のライブ ストリーミング シーン合成データベースは、高品質の「AI アンカー」の作成に役立ちますの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

ソース:sohu.com
このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。
人気のチュートリアル
詳細>
最新のダウンロード
詳細>
ウェブエフェクト
公式サイト
サイト素材
フロントエンドテンプレート