Volcano Engine が自社開発したビデオ コーデック チップが本日正式にリリースされ、業界の主流と比較して圧縮効率が 30% 以上向上しました
8 月 22 日の Volcano Engine の公式ニュースによると、 Volcano Engine Video Cloud は、自社開発したビデオ コーデック チップの製造に成功し、本日正式にリリースされたと発表しました 。
公式には、このチップのビデオ圧縮効率は「業界主流のハードウェアエンコーダ」と比較して30%以上改善できると述べられており、将来的にはDouyinやXigua Videoなどのビデオサービスを提供し、オープンされる予定です。 Volcano Engine Video Cloud の顧客を通じて企業に提供します 。
Volcano Engine は、Douyin などのビデオ サービスの大規模な実践と洗練に基づいており、自社開発のビデオ エンコードおよびデコード技術を専用チップに統合し、圧縮効率が 30 以上向上していると報告されています。業界の主流のハードウェア エンコーダと比較して % であり、ビデオ オン デマンド、ライブ ブロードキャスト、画像圧縮、XR およびその他のビジネス シナリオに適用できます。

サードパーティデータによると、中国のトップ100アプリのうち、69%がビデオ機能を備えており、65%がオンデマンド機能を備えており、51%がライブブロードキャスト機能があり、32% がリアルタイムオーディオおよびビデオ機能を備えています。ビデオ アプリケーションは、コンテンツおよびエンターテイメント産業から汎インターネットおよび多くの伝統的な産業にまで拡大しています。
このサイトでは、一般的なコンピューティング機能を備えた CPU チップと比較して、Volcano Engine の自社開発チップはビデオのエンコードとデコードのタスクのみをサポートしているため、特定のシナリオではより高いコンピューティング密度を実現できることがわかりました。当局者は、「ビデオ コーデック チップ サーバーのトランスコーディング能力は、数百の CPU サーバーに相当する」と主張しています。
Volcano Engine の社長である Tan Dai 氏は、現在、ビデオ データの量が爆発的に増加しており、アプリケーション シナリオも拡大していると述べました。したがって、Volcano Engine は NVIDIA と協力して BMF (BabitMultiMediaFramework) マルチメディア処理フレームワークをオープンソース化し、CPU、GPU、ビデオ エンコードおよびデコード チップなどの異種コンピューティング リソースをより適切にサポートし、さまざまなシナリオでそれぞれの利点を最大限に発揮できるようにしました。オンラインビデオサービスのコンピューティング、ストレージ、伝送帯域幅のコストを削減します
Volcano Engine Video Cloud Architecture のテクニカルディレクターである Wang Yue 氏は、「ビデオビデオエンコーディングがアップグレードされるたびに、品質ビットレートは 50 ずつ低下します」と述べています。 % ですが、大規模なビデオ データ量の増加率は 2 倍を超えています。ビデオ エンコード規格の反復速度がビデオ データ量の増加率に追いついていないため、コンピューティング能力を突破する必要があります。ボトルネック」。
超高解像度/8KVR ライブ ブロードキャストやリアルタイムの音声とビデオのインタラクションなど、ますますリッチな低遅延ビデオ シナリオが台頭しているため、企業にとっては、撮影中にビデオ処理の品質と効率を確保することが特に重要です。コストを考慮して
Volcano Engine は、よりコスト効率の高いビデオ クラウド サービスをお客様に提供するために、コンピューティング能力、エクスペリエンス、インタラクションなどのさまざまな側面から探求を続けます。 Wang Yue 氏は、企業が自社で構築するビデオ アプリケーションには高度な技術の蓄積と資本コストが必要であると述べました。そこで、Volcano Engine は NVIDIA と協力して、BMF マルチメディア処理フレームワークをオープンソース化しました。ビデオ展開の基盤として、このフレームワークは企業にビデオの制作から消費までのフルリンク シナリオ サポートを提供し、開発者が低コストでビデオ アプリケーションを構築できるように支援します
Wang Yue 氏はまた、BMF フレームワークは Douyin にとって最良の選択であると述べました。長年にわたり磨き続けてきた実践経験。 Volcano Engine は、NVIDIA と協力して GPU 関連機能を徹底的に最適化し、より強力な並列コンピューティング機能を発揮できるようにしました
NVIDIA の開発およびテクノロジー部門のアジア太平洋地域ゼネラルマネージャーである Li Xipeng 氏は、NVIDIA と Volcano Engine は常に構築された BMF の目標は、新世代のビデオ処理の基本プラットフォームになることです
今後も、Volcano Engine と協力し続け、コミュニティやユーザーの意見に耳を傾け、NVIDIA の最新ソフトウェアとハードウェア プラットフォームを強化し、BMF フレームワークの改善を続けます。 Volcano Engine Intelligent Creation Cloud の AIGC 機能と組み合わせることで、Volcano Engine Video Cloud は、商品マーケティング、インタラクティブ エンターテイメント、オンライン教育、デジタル ファイナンス、インテリジェント ドライビング、およびその他のシナリオにおけるデジタル ピープルや仮想ライブ ブロードキャスト ルームなどの AIGC 機能を導入します。企業はコストを削減し、ユーザーエクスペリエンスを向上させます。
このサイトはまた、Volcano Engine の公式公式アカウントから、Volcano Engine Video Cloud が最近、大規模なビジュアル モデルを使用して古典的な香港映画の 4K 復元を初めて実行し、古い映画の復元をさらに改善するのに役立ったことに気づきました。画質。

Volcano Engine Intelligent Creation Cloud の責任者 Liao Qian 氏は、Intelligent Creation Cloud 製品が Douyin ライフサービス加盟店にスクリプトの創造性からすべてを提供していると紹介しました。また、データ フィードバックの完全な AI 機能により、企業や小売業者によるビデオ使用の敷居が大幅に下がります。データによると、インテリジェント クリエーション クラウド製品は 3,000 を超える企業や販売者にサービスを提供し、309 万以上のビデオが合成され、15 億 4,000 万件のビデオが公開されています。
マーケティング、スペース、ビジネス、知識のインタラクティブな体験が変化するビデオ時代において、Volcano Engine の社長である Tan Dai 氏は、ビデオ クラウド テクノロジーには、ビデオ制作、ビデオ処理、ビデオ消費の重要な使命。 AIGC やその他の形式のテクノロジーの台頭により、より多くの情報を提供し、審査時間を短縮することを目的としています。この結果は参考用です。このサイトのすべての記事にこの声明が含まれていることに注意してください
以上がVolcano Engine が自社開発したビデオ コーデック チップが本日正式にリリースされ、業界の主流と比較して圧縮効率が 30% 以上向上しましたの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

ホットAIツール

Undresser.AI Undress
リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover
写真から衣服を削除するオンライン AI ツール。

Undress AI Tool
脱衣画像を無料で

Clothoff.io
AI衣類リムーバー

Video Face Swap
完全無料の AI 顔交換ツールを使用して、あらゆるビデオの顔を簡単に交換できます。

人気の記事

ホットツール

メモ帳++7.3.1
使いやすく無料のコードエディター

SublimeText3 中国語版
中国語版、とても使いやすい

ゼンドスタジオ 13.0.1
強力な PHP 統合開発環境

ドリームウィーバー CS6
ビジュアル Web 開発ツール

SublimeText3 Mac版
神レベルのコード編集ソフト(SublimeText3)

ホットトピック











Volcano Engine の社長である Tan Dai 氏は、大規模モデルを実装したい企業は、モデルの有効性、推論コスト、実装の難易度という 3 つの重要な課題に直面していると述べました。複雑な問題を解決するためのサポートとして、適切な基本的な大規模モデルが必要です。また、サービスは低コストの推論を備えているため、大規模なモデルを広く使用できるようになり、企業がシナリオを実装できるようにするためには、より多くのツール、プラットフォーム、アプリケーションが必要になります。 ——Huoshan Engine 01 社長、Tan Dai 氏。大きなビーンバッグ モデルがデビューし、頻繁に使用されています。モデル効果を磨き上げることは、AI の実装における最も重要な課題です。 Tan Dai 氏は、良いモデルは大量に使用することでのみ磨かれると指摘しました。現在、Doubao モデルは毎日 1,200 億トークンのテキストを処理し、3,000 万枚の画像を生成しています。企業による大規模モデルシナリオの実装を支援するために、バイトダンスが独自に開発した豆包大規模モデルが火山を通じて打ち上げられます。

1 年以上の開発を経て、AIGC はテキスト対話と画像生成からビデオ生成に徐々に移行してきました。 4 か月前を振り返ると、Sora の誕生によりビデオ生成トラックに再編が起こり、ビデオ作成分野における AIGC の適用範囲と深さが精力的に促進されました。大型モデルの話題が飛び交う時代において、私たちは映像生成による視覚的な衝撃に驚かされる一方で、実装の難しさに直面しています。確かに大規模モデルは技術研究開発から応用実践までまだ慣らし運転の段階にあり、実際のビジネスシナリオに基づいたチューニングが必要ですが、理想と現実の距離は徐々に縮まりつつあります。マーケティングは、人工知能テクノロジーの重要な実装シナリオとして、多くの企業や実務家がブレークスルーを実現したい方向性となっています。適切な方法をマスターすると、ビデオをマーケティングするクリエイティブなプロセスがより簡単になります。

このたび、Volcano Engine 音声合成製品は、国家音声画像認識製品品質検査試験センター(以下、「AI 国家検査センター」)が発行する音声合成強化検査試験証明書を取得し、以下の基準を満たしました。音声合成の基本要件と拡張要件 AI 国家検査センターの最高レベルの標準。この評価は、標準中国語、複数の方言、複数の言語、混合言語、複数の音色、およびパーソナライゼーションの側面から実施され、製品のテクニカル サポート チームである Volcano Voice チームが豊富なサウンド ライブラリを提供します。音色MOSスコアは4.64点と業界トップクラスの最高スコアを記録しました。我が国の品質検査システムにおける人工知能分野における音声および画像製品の最初で唯一の国家品質検査および試験機関として、AI 国家検査センターはインテリジェント化の促進に取り組んできました。

1. 消費者は製品を購入する前に、ソーシャル メディアで製品レビューを検索および閲覧します。したがって、企業にとってソーシャルプラットフォームで製品をマーケティングすることがますます重要になっています。マーケティングの目的は次のとおりです。 製品の販売促進 ブランド イメージの確立 ブランド認知度の向上 顧客の誘致と維持 最終的に企業の収益性の向上 大型モデルは優れた理解力と生成機能を備えており、閲覧と分析によってユーザーにパーソナライズされた情報を提供できますユーザーデータコンテンツの推奨事項。 「AIGC体験スクール」第4回では、「マーケティングコンバージョン率」向上におけるAIGCテクノロジーの役割について、ゲスト2名が深く語り合います。ライブ配信時間: 7 月 10 日 19:00 ~ 19:45 ライブ配信トピック: ユーザーの維持、AIGC はパーソナライゼーションを通じてコンバージョン率をどのように向上させますか?番組第4話では大切なお二人をお招きしました

長年にわたり、Volcano Engine は、一般的なビデオ プラットフォーム向けに、音声認識テクノロジーに基づいたインテリジェントなビデオ字幕ソリューションを提供してきました。簡単に言うと、AI技術を利用して動画内の音声や歌詞を自動でテキスト化し、動画作成を支援する機能です。しかし、プラットフォーム ユーザーの急速な増加と、より豊富で多様な言語タイプの要求に伴い、従来使用されてきた教師あり学習テクノロジーがますますボトルネックに達し、チームは大きな問題に直面しています。ご存知のとおり、従来の教師あり学習は、特に大規模言語の継続的な最適化や小規模言語のコールド スタートにおいて、手動で注釈が付けられた教師ありデータに大きく依存します。中国語、北京語、英語などの主要言語を例に挙げると、ビデオプラットフォームはビジネスシナリオに十分な音声データを提供しますが、教師付きデータが一定の規模に達した後は、継続的に音声データを提供します。

国慶節中、Douyin の「方言の一言は故郷の出身であることを証明する」キャンペーンに全国のネットユーザーの熱狂的な参加を集め、このテーマは Douyin チャレンジ リストのトップとなり、再生回数は 5,000 万回を超えました。この「地方方言大賞」はインターネット上で瞬く間に人気を博しましたが、これにはDouyinが新たに開始した地方方言自動翻訳機能の貢献が不可欠です。クリエイターが母国語の方言で短いビデオを録画した場合、「自動字幕」機能を使用して「北京語字幕に変換」を選択すると、ビデオ内の方言の音声が自動的に認識され、方言の内容が北京語の字幕に変換されます。これにより、他の地域のネットユーザーもさまざまな「暗号化された北京語」言語を簡単に理解できるようになります。福建省のネチズンが個人的に試してみたところ、「発音が異なる」福建省南部も中国福建省の地域であるとのこと。

Health + AI =? 中高年向け脳健康栄養ソリューション、デジタルインテリジェント栄養・健康サービス、AIGCビッグヘルスコミュニティソリューション…「Health + AI」エコロジーイノベーション競争の展開により、それぞれに含まれる内容革新的なソリューションが登場しようとしており、「健康 + AI =?」に対する答えが徐々に明らかになりつつあります。 12月26日、Yili GroupとVolcano Engineが共催した「Health + AI」エコロジーイノベーションコンペティションが成功裡に閉幕し、Shanghai Bosten Network Technology Co., Ltd.やZhongke Suzhou Intelligent Computing Technology Research Instituteなど6社が優勝した。際立っていた。 1か月以上続いたコンテストで、伊利氏は優れた科学技術企業と手を組み、AI技術と健康産業の徹底的な統合を模索し、コンテストへの期待を高め続けた。 「健康+AI」エコイノベーションコンペティション

このほど、CVPR2022の各種コンペティションの結果が発表され、ByteDanceの知的創造AIプラットフォーム「Byte-IC-AutoML」チームが、自社開発した合成データに基づくAccessibility Vision and Autonomy Challenge(以下、AVA)で優勝した。 Parallel Pre-trained Transformers (PPT) フレームワークは、コンテストの唯一のトラックの勝者として際立っていました。論文アドレス: https://arxiv.org/abs/2206.10845 この AVA コンテストはボストン大学 (Bos) によって後援されています。
