Huoshan Voice TTS の技術力は国家検査検疫センターによって認定されており、MOS スコアは 4.64 という高さです。-AI-php.cn

ホームページ

テクノロジー周辺機器

Huoshan Voice TTS の技術力は国家検査検疫センターによって認定されており、MOS スコアは 4.64 という高さです。

王林

Apr 12, 2023 am 10:40 AM

火山エンジン

最近、Volcano Engine 音声合成製品は、National Speech and Image Recognition Product Quality Inspection and Testing Center (以下、「」といいます) によって発行された 音声合成強化検査およびテスト証明書 を取得しました。 AI 国家検査センター」)。音声合成の基本要件と拡張要件は、AI 国家検査センターの 最高レベルの基準 に達しています。この評価は、標準中国語、複数の方言、複数の言語、混合言語、複数の音色、パーソナライゼーションの側面から行われ、製品のテクニカルサポートチームである Volcano Voice チームが豊富なサウンドライブラリを提供します。 MOS 最高スコアは業界トップレベルの4.64点に達します。

Huoshan Voice TTS の技術力は国家検査検疫センターによって認定されており、MOS スコアは 4.64 という高さです。

人工知能分野における最初で唯一の国家レベルの音声および画像製品品質検査システムとして、国の検査試験機関である AI 国家検査センターは、インテリジェント音声業界の健全な発展の促進に取り組んでいます。今回AI国家検査センターから権威ある認証を取得したことは、Huoshan Voiceの音声合成技術能力が業界をリードするレベルに達していることを十分に証明している。

火山音声合成の効果を実感してください: https://www.php . cn/link/8e0ce414531179ae9b7f60e20351ee8b

##さらなるサウンド体験:

https://www.php.cn/link/a1ada9947e0d683b4625f94c74104d73 Huoshan Voice は長い間、Bytedance の主要な事業分野をターゲットにしており、 Volcano Engine ToB 業界と革新的なシナリオは、業界をリードする AI 音声テクノロジー機能と優れたフルスタック音声製品ソリューションを提供します。現在、チームの音声認識と音声合成は複数の言語と方言をカバーしており、音声とビデオ、音声読み上げ、音声対話、ゲーム、広告、その他のアプリケーションシナリオをカバーしており、Douyin、Jianying、Feishu、Tomato Novels、 Pico など。中核となるビジネスは、最先端の音声機能を提供します。

このコンテストに参加する Volcano Engine 音声合成製品

は、Volcano Voice チームによって独自に開発され、業界をリードする生成ニューラルネットワーク技術

を使用していることがわかります。主に構成されているのは、フロントエンドテキスト分析、音響モデル、ボコーダーの 3 つの主要なモジュールで構成されており、具体的には次のとおりです:

フロントエンドテキスト分析:主に、テキストの正規化 (数値を年の読みや数値の読みに変換するなど)、文字の発音変換 (特に複数発音文字の問題を解決するための中国語の発音表記など) などのわかりやすさを担当します。単語の分割や韻の予測など。

音響モデル:主に言語特徴から音響特徴までのモデリングを担当します。データによると、Huoshan Voice TTS のバックエンド精度率は 99.90% に達する可能性があります。同時に、このモデルは、複数の感情やスタイルの洗練された制御、異なる音色間でのスタイルの転送もサポートし、単一言語のトレーニングデータのみを使用して多言語合成効果を達成することもできます。
ボコーダーモジュール: 主に音響特徴をオーディオ信号にモデリングする役割を果たします。現在、Volcano Voice チームは、敵対的ニューラルネットワークモデリングに基づいたボコーダーを自己開発しており、その精度は最大 99.95% です。軽量モデル設計とエンジニアリングの最適化に依存して、クラウドでのリアルタイムレートは 1 年以上に達します。何百回も。
Volcano Engine 音声合成製品は、リアルで自然なサウンド、鮮やかな解釈、多様なスタイルを備えていると同時に、現実の人々のリズムを復元します。言語現象は、人々に臨場感あふれるリスニング体験をもたらします。 Volcano Voiceチームが最近リリースした超自然対話音声合成技術も同様で、従来のTTSと比較して、モーダル助詞、吸気音、ためらいの音の間、発音の伸びなどの細部まで完璧に再現でき、従来のサウンドライブラリが必要な1/4データ。

「トーン再現技術」もVolcano Voiceチームが開発したものです。

従来の音声合成技術ではデータの閾値が高く要求されていましたが、Volcano 音声音色再現技術では従来のデータ量の 0.3% しか必要としません。一般の人は比較的静かな環境で作業できます。オープン環境で 2 分以上録音すると、音色空間モデリングの基準を満たし、専用の音色の AI モデルを生成できるため、便利で効率的です。

現在、Huoshan Voice は長年磨いてきた音声技術機能を市場に投入し、Volcano エンジンを通じて外部企業に開放していきます。 Volkswagen Automotive や Zhuishu Artifact など、業界の多くの大手企業が、AI 音声機能の応用と拡張を実現しています。は、より大きな価値を達成するために、最先端のテクノロジーとビジネスシナリオの効率的な組み合わせを模索し続け、ユーザーエクスペリエンスとビジネスの成長に革新的なエネルギーを注入し続けます。

以上がHuoshan Voice TTS の技術力は国家検査検疫センターによって認定されており、MOS スコアは 4.64 という高さです。の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

このウェブサイトの声明

この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

ホットAIツール

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

脱衣画像を無料で

Clothoff.io

AI衣類リムーバー

AI Hentai Generator

AIヘンタイを無料で生成します。

ホットツール

メモ帳++7.3.1

使いやすく無料のコードエディター

SublimeText3 中国語版

中国語版、とても使いやすい

ゼンドスタジオ 13.0.1

強力な PHP 統合開発環境

ドリームウィーバー CS6

ビジュアル Web 開発ツール

SublimeText3 Mac版

神レベルのコード編集ソフト（SublimeText3）

ホットトピック

Gmailメールのログイン入り口はどこですか？

7564

CakePHP チュートリアル

1386

Steamのアカウント名の形式は何ですか

Win11 Activation Key Permanent

NYTの接続はヒントと回答です

101

Related knowledge

Bytedance Beanbao 大型モデルがリリース、Volcano Engine フルスタック AI サービスが企業のインテリジェントな変革を支援 Jun 05, 2024 pm 07:59 PM

Volcano Engine の社長である Tan Dai 氏は、大規模モデルを実装したい企業は、モデルの有効性、推論コスト、実装の難易度という 3 つの重要な課題に直面していると述べました。複雑な問題を解決するためのサポートとして、適切な基本的な大規模モデルが必要です。また、サービスは低コストの推論を備えているため、大規模なモデルを広く使用できるようになり、企業がシナリオを実装できるようにするためには、より多くのツール、プラットフォーム、アプリケーションが必要になります。 ——Huoshan Engine 01 社長、Tan Dai 氏。大きなビーンバッグモデルがデビューし、頻繁に使用されています。モデル効果を磨き上げることは、AI の実装における最も重要な課題です。 Tan Dai 氏は、良いモデルは大量に使用することでのみ磨かれると指摘しました。現在、Doubao モデルは毎日 1,200 億トークンのテキストを処理し、3,000 万枚の画像を生成しています。企業による大規模モデルシナリオの実装を支援するために、バイトダンスが独自に開発した豆包大規模モデルが火山を通じて打ち上げられます。

マーケティング効果が大幅アップ、AIGC動画制作はこう活用すべき Jun 25, 2024 am 12:01 AM

1 年以上の開発を経て、AIGC はテキスト対話と画像生成からビデオ生成に徐々に移行してきました。 4 か月前を振り返ると、Sora の誕生によりビデオ生成トラックに再編が起こり、ビデオ作成分野における AIGC の適用範囲と深さが精力的に促進されました。大型モデルの話題が飛び交う時代において、私たちは映像生成による視覚的な衝撃に驚かされる一方で、実装の難しさに直面しています。確かに大規模モデルは技術研究開発から応用実践までまだ慣らし運転の段階にあり、実際のビジネスシナリオに基づいたチューニングが必要ですが、理想と現実の距離は徐々に縮まりつつあります。マーケティングは、人工知能テクノロジーの重要な実装シナリオとして、多くの企業や実務家がブレークスルーを実現したい方向性となっています。適切な方法をマスターすると、ビデオをマーケティングするクリエイティブなプロセスがより簡単になります。

Huoshan Voice TTS の技術力は国家検査検疫センターによって認定されており、MOS スコアは 4.64 という高さです。 Apr 12, 2023 am 10:40 AM

このたび、Volcano Engine 音声合成製品は、国家音声画像認識製品品質検査試験センター（以下、「AI 国家検査センター」）が発行する音声合成強化検査試験証明書を取得し、以下の基準を満たしました。音声合成の基本要件と拡張要件 AI 国家検査センターの最高レベルの標準。この評価は、標準中国語、複数の方言、複数の言語、混合言語、複数の音色、およびパーソナライゼーションの側面から実施され、製品のテクニカルサポートチームである Volcano Voice チームが豊富なサウンドライブラリを提供します。音色MOSスコアは4.64点と業界トップクラスの最高スコアを記録しました。我が国の品質検査システムにおける人工知能分野における音声および画像製品の最初で唯一の国家品質検査および試験機関として、AI 国家検査センターはインテリジェント化の促進に取り組んできました。

パーソナライズされたエクスペリエンスに重点を置き、ユーザーの維持は完全に AIGC に依存していますか? Jul 15, 2024 pm 06:48 PM

1. 消費者は製品を購入する前に、ソーシャルメディアで製品レビューを検索および閲覧します。したがって、企業にとってソーシャルプラットフォームで製品をマーケティングすることがますます重要になっています。マーケティングの目的は次のとおりです。製品の販売促進ブランドイメージの確立ブランド認知度の向上顧客の誘致と維持最終的に企業の収益性の向上大型モデルは優れた理解力と生成機能を備えており、閲覧と分析によってユーザーにパーソナライズされた情報を提供できますユーザーデータコンテンツの推奨事項。「AIGC体験スクール」第4回では、「マーケティングコンバージョン率」向上におけるAIGCテクノロジーの役割について、ゲスト2名が深く語り合います。ライブ配信時間: 7 月 10 日 19:00 ～ 19:45 ライブ配信トピック: ユーザーの維持、AIGC はパーソナライゼーションを通じてコンバージョン率をどのように向上させますか?番組第4話では大切なお二人をお招きしました

Huoshan Voice の教師なし事前トレーニング技術と「アルゴリズムの最適化 + エンジニアリングの革新」の実装を徹底調査 Apr 08, 2023 pm 12:44 PM

長年にわたり、Volcano Engine は、一般的なビデオプラットフォーム向けに、音声認識テクノロジーに基づいたインテリジェントなビデオ字幕ソリューションを提供してきました。簡単に言うと、AI技術を利用して動画内の音声や歌詞を自動でテキスト化し、動画作成を支援する機能です。しかし、プラットフォームユーザーの急速な増加と、より豊富で多様な言語タイプの要求に伴い、従来使用されてきた教師あり学習テクノロジーがますますボトルネックに達し、チームは大きな問題に直面しています。ご存知のとおり、従来の教師あり学習は、特に大規模言語の継続的な最適化や小規模言語のコールドスタートにおいて、手動で注釈が付けられた教師ありデータに大きく依存します。中国語、北京語、英語などの主要言語を例に挙げると、ビデオプラットフォームはビジネスシナリオに十分な音声データを提供しますが、教師付きデータが一定の規模に達した後は、継続的に音声データを提供します。

すべての Douyin はネイティブの方言を話しています。2 つの主要なテクノロジーが地元の方言を「理解」するのに役立ちます Oct 12, 2023 pm 08:13 PM

国慶節中、Douyin の「方言の一言は故郷の出身であることを証明する」キャンペーンに全国のネットユーザーの熱狂的な参加を集め、このテーマは Douyin チャレンジリストのトップとなり、再生回数は 5,000 万回を超えました。この「地方方言大賞」はインターネット上で瞬く間に人気を博しましたが、これにはDouyinが新たに開始した地方方言自動翻訳機能の貢献が不可欠です。クリエイターが母国語の方言で短いビデオを録画した場合、「自動字幕」機能を使用して「北京語字幕に変換」を選択すると、ビデオ内の方言の音声が自動的に認識され、方言の内容が北京語の字幕に変換されます。これにより、他の地域のネットユーザーもさまざまな「暗号化された北京語」言語を簡単に理解できるようになります。福建省のネチズンが個人的に試してみたところ、「発音が異なる」福建省南部も中国福建省の地域であるとのこと。

Volcano EngineとYiliが共同主催した「Health + AI」エコロジーイノベーションコンテストが成功裡に終了 Jan 13, 2024 am 11:57 AM

Health + AI =? 中高年向け脳健康栄養ソリューション、デジタルインテリジェント栄養・健康サービス、AIGCビッグヘルスコミュニティソリューション…「Health + AI」エコロジーイノベーション競争の展開により、それぞれに含まれる内容革新的なソリューションが登場しようとしており、「健康 + AI =?」に対する答えが徐々に明らかになりつつあります。 12月26日、Yili GroupとVolcano Engineが共催した「Health + AI」エコロジーイノベーションコンペティションが成功裡に閉幕し、Shanghai Bosten Network Technology Co., Ltd.やZhongke Suzhou Intelligent Computing Technology Research Instituteなど6社が優勝した。際立っていた。 1か月以上続いたコンテストで、伊利氏は優れた科学技術企業と手を組み、AI技術と健康産業の徹底的な統合を模索し、コンテストへの期待を高め続けた。「健康＋AI」エコイノベーションコンペティション

バリアフリーで旅行も安心！ ByteDanceの研究成果がCVPR2022 AVAコンペティションチャンピオンシップで優勝 Apr 08, 2023 pm 11:01 PM

このほど、CVPR2022の各種コンペティションの結果が発表され、ByteDanceの知的創造AIプラットフォーム「Byte-IC-AutoML」チームが、自社開発した合成データに基づくAccessibility Vision and Autonomy Challenge（以下、AVA）で優勝した。 Parallel Pre-trained Transformers (PPT) フレームワークは、コンテストの唯一のトラックの勝者として際立っていました。論文アドレス: https://arxiv.org/abs/2206.10845 この AVA コンテストはボストン大学 (Bos) によって後援されています。

See all articles

Huoshan Voice TTS の技術力は国家検査検疫センターによって認定されており、MOS スコアは 4.64 という高さです。

ホットAIツール

Undresser.AI Undress

AI Clothes Remover

Undress AI Tool

Clothoff.io

AI Hentai Generator

人気の記事

ホットツール

メモ帳++7.3.1

SublimeText3 中国語版

ゼンドスタジオ 13.0.1

ドリームウィーバー CS6

SublimeText3 Mac版

ホットトピック