ホームページ テクノロジー周辺機器 AI Volcano Engine による Beyond のクラシック コンサートの超鮮明な復元、技術的能力が一般公開されました

Volcano Engine による Beyond のクラシック コンサートの超鮮明な復元、技術的能力が一般公開されました

Apr 09, 2023 pm 11:51 PM
火山エンジン 超解像アルゴリズム AIノイズリダクション

7月3日の夜、DouyinはユニバーサルミュージックのレーベルPolyGramと協力して、火山エンジンによって超鮮明に復元されたBeyond Live 1991ライフコンタクトコンサートと記念コンサートの厳選されたコンテンツをライブブロードキャストし、注目を集めました。 1.4億回以上の再生回数。

Beyond は 1983 年に設立されたロック バンドです。広東音楽の隆盛とともに、Beyond バンドの名前は時代の文化的な痕跡となりました。 「Beyond Live 1991」は、Beyond が紅磡競技場で開催した最初のコンサートで、その後ポリグラムからリリースされた DVD は 1990 年代にはほとんど入手困難でした。以来 31 年が経ち、このコンサートは何世代にもわたるファンの音楽的啓蒙と青春の思い出となっています。

当時の撮影機材、記憶媒体、録​​音機器の技術の制限により、インターネット上で流通したコンサートマスターテープやさまざまなバージョンの音声や映像の品質は低かった。視聴体験を向上させ、クラシックな Beyond を再現するために、Volcano Engine は画質と音質の点で復元されました。

火山エンジン マルチメディア研究所によると、初期のソフトウェアとハ​​ードウェア機器は後進的であり、その結果、制作、圧縮、送信中にぼやけた画像、テクスチャの損失、ノイズ欠陥などの問題が発生しました。映画の。可能な限り細部を復元しながら画質を向上させ、色の最適化とレトロな雰囲気を維持し、さまざまなサイズや姿勢のポートレートの復元効果を調整することが、この復元の難しさです。

「私たちの目標は、全体的な画像の鮮明さ、顔の特徴の復元、色の明るさ、流暢さ、美しさの点で画質を向上させることです。」 画質に関しては、この本は次のとおりです。 2 番目の修復では、明瞭度向上、欠陥修復、局所的な色の明るさ向上などのアルゴリズムを使用して、初期段階で旧バージョンのソフトウェアおよびハードウェア機器によって引き起こされる問題に対処します。ビデオ解像度は 540p 未満から 4K レベル近くまで向上し、フレーム レートは 25fps から 60fps に向上しました。

Volcano Engine による Beyond のクラシック コンサートの超鮮明な復元、技術的能力が一般公開されました

ポートレート強化アルゴリズムにより、Huang Jiaju の顔のアイライン、毛穴、その他の細部がはっきりと見えます

さらに、Volcano Engine Multimedia Laboratory は、顔の圧縮損傷、ぼやけ、低解像度などの問題を修復および強化するための自己適応型ポートレート強化アルゴリズムも開発しています。この技術はディープラーニングに基づいており、顔全体のぼやけや圧縮ダメージを除去するだけでなく、顔の主要な特徴を詳細に再構築します。修復後は、キャラクターの顔のひげや毛穴がはっきりと見えるようになり、視聴者により良い視覚体験を提供します。

音質修復の観点から、Volcano Engine オーディオ テクノロジー チームは、オーディオ ノイズ リダクション、オーディオ超解像度、およびラウドネス アルゴリズムを使用して、ノイズを除去し、音質を向上させ、次のような問題を解決します。音量、ノイズ干渉、帯域幅不足。

従来のノイズリダクションソリューションとは異なり、音楽シーンやボーカルシーンに対応したAIノイズリダクションアルゴリズムを実装したノイズリダクションアルゴリズムで、音楽やボーカルを残すことを前提に周囲の騒音を抑制します。オーディオ超解像アルゴリズムは、コンサートのボーカル部分の周波数帯域を拡張し、高周波情報を豊かにし、ボーカルをよりクリアにします。スペクトログラムからは、超解像モジュールの処理により、元の音声の高周波部分が拡張され強化されていることがわかります。

Volcano Engine による Beyond のクラシック コンサートの超鮮明な復元、技術的能力が一般公開されました

音声超解像アルゴリズムの処理により、オリジナルの音声が再生されます。 12kHz以上 音声情報はある程度完成し修復されています

コンサートの集音条件の違いにより、コンサート中の歌声が乱れることがあります。楽器の音や環境音に比べて小さすぎるため、Volcano Engine オーディオ テクノロジー チームは、ラウドネス アルゴリズムを使用して、最初に歌っている部分を個別に抽出し、次に歌っている部分の音量を調整し、最後にそれをミックスして全体的な人間のサウンドを作成します。声がもっと快適に。

コンサートのこれらの復元機能は、Volcano Engine インテリジェント処理およびオーディオ技術製品を通じて外部の世界に提供されていることがわかります。さらに、Volcano Engine は、アップロード、トランスコーディング、送信、消費、その他のリンクをカバーする、画質に関するフルリンクのエンドツーエンド ソリューションを外部に公開し、ビデオ コンテンツの総合的な最適化を実現します。画質、ビットレート、エクスペリエンス。

デジタルテクノロジーは文化継承を推進する原動力になりつつあります。関連報道によると、2021年10月にXigua VideoとVolcano Engineは「クラシックビデオ4K復元計画」を立ち上げ、技術的手段を通じて合計71点の古典漫画が復元されたとのこと。復元されたコンテンツはXigua VideoとFreshで無料でダウンロードできるタイムテレビウォッチ。

Volcano Engine の担当者は、将来的には、より高度な技術を使用して古典的な画像を復元し、新たな生命を吹き込むだろうと述べています。



#

以上がVolcano Engine による Beyond のクラシック コンサートの超鮮明な復元、技術的能力が一般公開されましたの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

ホットAIツール

Undresser.AI Undress

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

Undress AI Tool

脱衣画像を無料で

Clothoff.io

Clothoff.io

AI衣類リムーバー

AI Hentai Generator

AI Hentai Generator

AIヘンタイを無料で生成します。

ホットツール

メモ帳++7.3.1

メモ帳++7.3.1

使いやすく無料のコードエディター

SublimeText3 中国語版

SublimeText3 中国語版

中国語版、とても使いやすい

ゼンドスタジオ 13.0.1

ゼンドスタジオ 13.0.1

強力な PHP 統合開発環境

ドリームウィーバー CS6

ドリームウィーバー CS6

ビジュアル Web 開発ツール

SublimeText3 Mac版

SublimeText3 Mac版

神レベルのコード編集ソフト(SublimeText3)

Bytedance Beanbao 大型モデルがリリース、Volcano Engine フルスタック AI サービスが企業のインテリジェントな変革を支援 Bytedance Beanbao 大型モデルがリリース、Volcano Engine フルスタック AI サービスが企業のインテリジェントな変革を支援 Jun 05, 2024 pm 07:59 PM

Volcano Engine の社長である Tan Dai 氏は、大規模モデルを実装したい企業は、モデルの有効性、推論コスト、実装の難易度という 3 つの重要な課題に直面していると述べました。複雑な問題を解決するためのサポートとして、適切な基本的な大規模モデルが必要です。また、サービスは低コストの推論を備えているため、大規模なモデルを広く使用できるようになり、企業がシナリオを実装できるようにするためには、より多くのツール、プラットフォーム、アプリケーションが必要になります。 ——Huoshan Engine 01 社長、Tan Dai 氏。大きなビーンバッグ モデルがデビューし、頻繁に使用されています。モデル効果を磨き上げることは、AI の実装における最も重要な課題です。 Tan Dai 氏は、良いモデルは大量に使用することでのみ磨かれると指摘しました。現在、Doubao モデルは毎日 1,200 億トークンのテキストを処理し、3,000 万枚の画像を生成しています。企業による大規模モデルシナリオの実装を支援するために、バイトダンスが独自に開発した豆包大規模モデルが火山を通じて打ち上げられます。

マーケティング効果が大幅アップ、AIGC動画制作はこう活用すべき マーケティング効果が大幅アップ、AIGC動画制作はこう活用すべき Jun 25, 2024 am 12:01 AM

1 年以上の開発を経て、AIGC はテキスト対話と画像生成からビデオ生成に徐々に移行してきました。 4 か月前を振り返ると、Sora の誕生によりビデオ生成トラックに再編が起こり、ビデオ作成分野における AIGC の適用範囲と深さが精力的に促進されました。大型モデルの話題が飛び交う時代において、私たちは映像生成による視覚的な衝撃に驚かされる一方で、実装の難しさに直面しています。確かに大規模モデルは技術研究開発から応用実践までまだ慣らし運転の段階にあり、実際のビジネスシナリオに基づいたチューニングが必要ですが、理想と現実の距離は徐々に縮まりつつあります。マーケティングは、人工知能テクノロジーの重要な実装シナリオとして、多くの企業や実務家がブレークスルーを実現したい方向性となっています。適切な方法をマスターすると、ビデオをマーケティングするクリエイティブなプロセスがより簡単になります。

Huoshan Voice TTS の技術力は国家検査検疫センターによって認定されており、MOS スコアは 4.64 という高さです。 Huoshan Voice TTS の技術力は国家検査検疫センターによって認定されており、MOS スコアは 4.64 という高さです。 Apr 12, 2023 am 10:40 AM

このたび、Volcano Engine 音声合成製品は、国家音声画像認識製品品質検査試験センター(以下、「AI 国家検査センター」)が発行する音声合成強化検査試験証明書を取得し、以下の基準を満たしました。音声合成の基本要件と拡張要件 AI 国家検査センターの最高レベルの標準。この評価は、標準中国語、複数の方言、複数の言語、混合言語、複数の音色、およびパーソナライゼーションの側面から実施され、製品のテクニカル サポート チームである Volcano Voice チームが豊富なサウンド ライブラリを提供します。音色MOSスコアは4.64点と業界トップクラスの最高スコアを記録しました。我が国の品質検査システムにおける人工知能分野における音声および画像製品の最初で唯一の国家品質検査および試験機関として、AI 国家検査センターはインテリジェント化の促進に取り組んできました。

パーソナライズされたエクスペリエンスに重点を置き、ユーザーの維持は完全に AIGC に依存していますか? パーソナライズされたエクスペリエンスに重点を置き、ユーザーの維持は完全に AIGC に依存していますか? Jul 15, 2024 pm 06:48 PM

1. 消費者は製品を購入する前に、ソーシャル メディアで製品レビューを検索および閲覧します。したがって、企業にとってソーシャルプラットフォームで製品をマーケティングすることがますます重要になっています。マーケティングの目的は次のとおりです。 製品の販売促進 ブランド イメージの確立 ブランド認知度の向上 顧客の誘致と維持 最終的に企業の収益性の向上 大型モデルは優れた理解力と生成機能を備えており、閲覧と分析によってユーザーにパーソナライズされた情報を提供できますユーザーデータコンテンツの推奨事項。 「AIGC体験スクール」第4回では、「マーケティングコンバージョン率」向上におけるAIGCテクノロジーの役割について、ゲスト2名が深く語り合います。ライブ配信時間: 7 月 10 日 19:00 ~ 19:45 ライブ配信トピック: ユーザーの維持、AIGC はパーソナライゼーションを通じてコン​​バージョン率をどのように向上させますか?番組第4話では大切なお二人をお招きしました

Huoshan Voice の教師なし事前トレーニング技術と「アルゴリズムの最適化 + エンジニアリングの革新」の実装を徹底調査 Huoshan Voice の教師なし事前トレーニング技術と「アルゴリズムの最適化 + エンジニアリングの革新」の実装を徹底調査 Apr 08, 2023 pm 12:44 PM

長年にわたり、Volcano Engine は、一般的なビデオ プラットフォーム向けに、音声認識テクノロジーに基づいたインテリジェントなビデオ字幕ソリューションを提供してきました。簡単に言うと、AI技術を利用して動画内の音声や歌詞を自動でテキスト化し、動画作成を支援する機能です。しかし、プラットフォーム ユーザーの急速な増加と、より豊富で多様な言語タイプの要求に伴い、従来使用されてきた教師あり学習テクノロジーがますますボトルネックに達し、チームは大きな問題に直面しています。ご存知のとおり、従来の教師あり学習は、特に大規模言語の継続的な最適化や小規模言語のコールド スタートにおいて、手動で注釈が付けられた教師ありデータに大きく依存します。中国語、北京語、英語などの主要言語を例に挙げると、ビデオプラットフォームはビジネスシナリオに十分な音声データを提供しますが、教師付きデータが一定の規模に達した後は、継続的に音声データを提供します。

すべての Douyin はネイティブの方言を話しています。2 つの主要なテクノロジーが地元の方言を「理解」するのに役立ちます すべての Douyin はネイティブの方言を話しています。2 つの主要なテクノロジーが地元の方言を「理解」するのに役立ちます Oct 12, 2023 pm 08:13 PM

国慶節中、Douyin の「方言の一言は故郷の出身であることを証明する」キャンペーンに全国のネットユーザーの熱狂的な参加を集め、このテーマは Douyin チャレンジ リストのトップとなり、再生回数は 5,000 万回を超えました。この「地方方言大賞」はインターネット上で瞬く間に人気を博しましたが、これにはDouyinが新たに開始した地方方言自動翻訳機能の貢献が不可欠です。クリエイターが母国語の方言で短いビデオを録画した場合、「自動字幕」機能を使用して「北京語字幕に変換」を選択すると、ビデオ内の方言の音声が自動的に認識され、方言の内容が北京語の字幕に変換されます。これにより、他の地域のネットユーザーもさまざまな「暗号化された北京語」言語を簡単に理解できるようになります。福建省のネチズンが個人的に試してみたところ、「発音が異なる」福建省南部も中国福建省の地域であるとのこと。

Volcano EngineとYiliが共同主催した「Health + AI」エコロジーイノベーションコンテストが成功裡に終了 Volcano EngineとYiliが共同主催した「Health + AI」エコロジーイノベーションコンテストが成功裡に終了 Jan 13, 2024 am 11:57 AM

Health + AI =? 中高年向け脳健康栄養ソリューション、デジタルインテリジェント栄養・健康サービス、AIGCビッグヘルスコミュニティソリューション…「Health + AI」エコロジーイノベーション競争の展開により、それぞれに含まれる内容革新的なソリューションが登場しようとしており、「健康 + AI =?」に対する答えが徐々に明らかになりつつあります。 12月26日、Yili GroupとVolcano Engineが共催した「Health + AI」エコロジーイノベーションコンペティションが成功裡に閉幕し、Shanghai Bosten Network Technology Co., Ltd.やZhongke Suzhou Intelligent Computing Technology Research Instituteなど6社が優勝した。際立っていた。 1か月以上続いたコンテストで、伊利氏は優れた科学技術企業と手を組み、AI技術と健康産業の徹底的な統合を模索し、コンテストへの期待を高め続けた。 「健康+AI」エコイノベーションコンペティション

バリアフリーで旅行も安心! ByteDanceの研究成果がCVPR2022 AVAコンペティションチャンピオンシップで優勝 バリアフリーで旅行も安心! ByteDanceの研究成果がCVPR2022 AVAコンペティションチャンピオンシップで優勝 Apr 08, 2023 pm 11:01 PM

このほど、CVPR2022の各種コンペティションの結果が発表され、ByteDanceの知的創造AIプラットフォーム「Byte-IC-AutoML」チームが、自社開発した合成データに基づくAccessibility Vision and Autonomy Challenge(以下、AVA)で優勝した。 Parallel Pre-trained Transformers (PPT) フレームワークは、コンテストの唯一のトラックの勝者として際立っていました。論文アドレス: https://arxiv.org/abs/2206.10845 この AVA コンテストはボストン大学 (Bos) によって後援されています。

See all articles