Volcano Engine 4K修復フィルムが北京映画祭に選出、関連技術がCVPR2024で優勝
4月18日、第14回北京国際映画祭が正式に開幕した。中国映画アーカイブ、Douyin、Volcano Engineが共同修復した香港映画「Plan A」と「The Pledge of Allegiance」が「賛辞と修復」部門に選ばれ、4月18日と19日に上映される。
『プランA』と『ザ・パクト』の映画ポスターの4Kバージョン
『プランA』と『ザ・パクト』はそれぞれ1983年と1978年に公開され、今から40年以上前です。 2023年8月、中国映画アーカイブ、Douyin、Volcano Engineは共同で「古典香港映画修復プロジェクト」を立ち上げ、100本の香港映画を修復すると発表した。今回上映された2本の映画は、上記のプロジェクトによるもので、映画のオリジナル撮影ネガは香港で4Kフォーマットでスキャンされ、修復プロセス全体には中国映画アーカイブによる物理的およびデジタル修復、VolcanoによるAI技術による修復が含まれています。エンジン、美術修復などの両者の協力。
Volcano Engine は Bytedance が所有するクラウド サービス プラットフォームで、Xigua Video と Douyin とそれぞれ協力して、100 本の国内クラシック アニメーションと Beyond クラシック コンサートの 4K 復元を完了しました。
「クラシック香港フィルム修復プロジェクト」では、Volcano Engine が AIGC テクノロジーを古いフィルム修復シーンに初めて適用し、大規模なビジュアル モデルの強力な生成機能と豊富な事前知識を使用して、鮮明さの点で修復効果を実現しました。色と滑らかさの精度と欠陥の除去の点で全面的に改善されました。ワード数: 78。
一方で、大規模モデル生成能力は強力であり、安定拡散大規模モデル生成能力の助けにより、修復効果は以前のアルゴリズムよりも優れており、一方で、画像の詳細はより自然です。大規模なモデルは非常に強力な情報構造化能力を備えており、大量のデータをペアリングした後、大量の知識を抽出してモデル パラメーターに「保存」でき、生成スペースがより豊富になり、より多くの修復シナリオに対応できます。 Volcano EngineのビデオクラウドテクノロジーアーキテクチャディレクターのWang Yue氏が紹介した。
現在、Volcano エンジンはアルゴリズムとエンジニアリングにおいて一連の最適化を行っており、特定のシーンで生成されやすいアーティファクトや偽テクスチャなどの大規模なビジュアル モデルのパフォーマンスと、マルチフレームの安定性を向上させています。ビデオシーンの処理効率と計算電力コスト。
徹底した修復作業に従って、火山エンジン マルチメディア研究所は、適応特徴重み付けモジュール、教師なし学習と教師あり学習の組み合わせ、テキスト意味論的事前学習、およびその他のトレーニング方法を導入することにより、大規模なビジュアル モデルをさらに最適化しました。非常に低品質のポートレートの再構成、色褪せたフィルムの色調整、テキストの欠落したストロークの生成など、いくつかの面で良好な結果を達成しました。
修理前と修理後
色あせたフィルムの色調整前後の比較
元のフィルムの「古いように修復された」質感を維持するために、技術チームは、損傷した画像テクスチャ、夜景の滑らかさを改善しながら、適応テクスチャも特別に開発しました。フィルムノイズをシミュレートするグレインを追加するノイズ除去およびその他のエフェクト。
同時に、古いフィルムの修復におけるさまざまな実際的な問題を解決することは、火山エンジンマルチメディア研究所の学術研究にも価値をもたらします。コンピューター ビジョンのトップ カンファレンス CVPR 2024 では、Volcano Engine Multimedia Laboratory が NTIRE ( Image Restoration and Enhancement) トラックで優勝しました。その優勝したソリューションは、プロンプト学習 (Prompt Learning) に基づいており、主に画像強調回復を解決します。多くの古いフィルムと同様に、予測できない複雑な損傷 (未知の複雑な劣化) を修復するという問題。
「古いフィルムの修復は実際に私たちが毎日行っていることです。」Wang Yue 氏は、古いフィルムの低解像度、低流暢性、色の歪み、欠陥などの一般的な画質問題は、Douyin の巨大なフィルムでも解決されていると述べました。提出物で。 Huoshan Engine は、Douyin にサービスを提供することで、古いフィルムを修復するためのインテリジェント処理技術ソリューションの比較的完全なセットを形成しました。
公開情報によると、フィルムの修復プロセスは複雑かつ簡単で、経験豊富な修復業者がフィルムを完成させるには 1 か月かかります。近年、ディープラーニングなどのAI技術により、古フィルム修復の品質と効率を大幅に向上させることが可能になりました。
香港城市大学コンピューターサイエンス学部助教授のマ・ケデ氏は、現在の人工知能技術の急速な発展は、将来的には同期外れの問題だけではなく、大きな可能性を示していると述べた。一部の古い映画のオーディオとビデオは AIGC を通じてより効果的に解決されますが、AI が修復効果を自動的に判断する方法を学習することも期待されています。
古い香港映画は、ジャッキー・チェンの卓越した演技力と「プラン A」でのスリリングなアクション シーン、そして「情事」でのシュー グァンウェンのユーモラスな演技は、多くの視聴者に数え切れないほどの驚きをもたらしてきました。修復技術の向上により、こうした過去の名作が甦ります。
「プランA」の先行上映活動中、ジャッキー・チェン中国副社長でシニア映画プロデューサーの孫栄氏は、ジャッキー・チェンが以前「イーグル」のトンネルの中に光があると信じていたことをその場でファンと共有した。 「フィルム修復プロジェクト」チームは、意見をもとに調整を加え、当時の創作の後悔を補った。
ダイナソー・ピクチャーズの創設者であり、ジャッキー・チェン・チャイナの元副社長であり、スパークル・ロール・フィルムズの副社長である孫栄氏が上映前に共有しました
現在、観客は「古典香港映画修復プロジェクト」をオンラインで視聴できますon Douyin, Xigua Video 「修復された映画については、残りの映画の4K修復版も順次リリースされます。
以上がVolcano Engine 4K修復フィルムが北京映画祭に選出、関連技術がCVPR2024で優勝の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

ホットAIツール

Undresser.AI Undress
リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover
写真から衣服を削除するオンライン AI ツール。

Undress AI Tool
脱衣画像を無料で

Clothoff.io
AI衣類リムーバー

AI Hentai Generator
AIヘンタイを無料で生成します。

人気の記事

ホットツール

メモ帳++7.3.1
使いやすく無料のコードエディター

SublimeText3 中国語版
中国語版、とても使いやすい

ゼンドスタジオ 13.0.1
強力な PHP 統合開発環境

ドリームウィーバー CS6
ビジュアル Web 開発ツール

SublimeText3 Mac版
神レベルのコード編集ソフト(SublimeText3)

ホットトピック









8月21日、2024年世界ロボット会議が北京で盛大に開催された。 SenseTimeのホームロボットブランド「Yuanluobot SenseRobot」は、全製品ファミリーを発表し、最近、世界初の家庭用チェスロボットとなるYuanluobot AIチェスプレイロボット - Chess Professional Edition(以下、「Yuanluobot SenseRobot」という)をリリースした。家。 Yuanluobo の 3 番目のチェス対局ロボット製品である新しい Guxiang ロボットは、AI およびエンジニアリング機械において多くの特別な技術アップグレードと革新を経て、初めて 3 次元のチェスの駒を拾う機能を実現しました。家庭用ロボットの機械的な爪を通して、チェスの対局、全員でのチェスの対局、記譜のレビューなどの人間と機械の機能を実行します。

もうすぐ学校が始まり、新学期を迎える生徒だけでなく、大型AIモデルも気を付けなければなりません。少し前、レディットはクロードが怠け者になったと不満を漏らすネチズンでいっぱいだった。 「レベルが大幅に低下し、頻繁に停止し、出力も非常に短くなりました。リリースの最初の週は、4 ページの文書全体を一度に翻訳できましたが、今では 0.5 ページの出力さえできません」 !」 https://www.reddit.com/r/ClaudeAI/comments/1by8rw8/something_just_feels_wrong_with_claude_in_the/ というタイトルの投稿で、「クロードには完全に失望しました」という内容でいっぱいだった。

北京で開催中の世界ロボット会議では、人型ロボットの展示が絶対的な注目となっているスターダストインテリジェントのブースでは、AIロボットアシスタントS1がダルシマー、武道、書道の3大パフォーマンスを披露した。文武両道を備えた 1 つの展示エリアには、多くの専門的な聴衆とメディアが集まりました。弾性ストリングのエレガントな演奏により、S1 は、スピード、強さ、正確さを備えた繊細な操作と絶対的なコントロールを発揮します。 CCTVニュースは、「書道」の背後にある模倣学習とインテリジェント制御に関する特別レポートを実施し、同社の創設者ライ・ジエ氏は、滑らかな動きの背後にあるハードウェア側が最高の力制御と最も人間らしい身体指標(速度、負荷)を追求していると説明した。など)、AI側では人の実際の動きのデータが収集され、強い状況に遭遇したときにロボットがより強くなり、急速に進化することを学習することができます。そしてアジャイル

ビジョンとロボット学習の緊密な統合。最近話題の1X人型ロボットNEOと合わせて、2つのロボットハンドがスムーズに連携して服をたたむ、お茶を入れる、靴を詰めるといった動作をしていると、いよいよロボットの時代が到来するのではないかと感じられるかもしれません。実際、これらの滑らかな動きは、高度なロボット技術 + 精緻なフレーム設計 + マルチモーダル大型モデルの成果です。有用なロボットは多くの場合、環境との複雑かつ絶妙な相互作用を必要とし、環境は空間領域および時間領域の制約として表現できることがわかっています。たとえば、ロボットにお茶を注いでもらいたい場合、ロボットはまずティーポットのハンドルを掴んで、お茶をこぼさないように垂直に保ち、次にポットの口がカップの口と揃うまでスムーズに動かす必要があります。 、そしてティーポットを一定の角度に傾けます。これ

会議の紹介 科学技術の急速な発展に伴い、人工知能は社会の進歩を促進する重要な力となっています。この時代に、分散型人工知能 (DAI) の革新と応用を目撃し、参加できることは幸運です。分散型人工知能は人工知能分野の重要な分野であり、近年ますます注目を集めています。大規模言語モデル (LLM) に基づくエージェントは、大規模モデルの強力な言語理解機能と生成機能を組み合わせることで、自然言語対話、知識推論、タスク計画などにおいて大きな可能性を示しました。 AIAgent は大きな言語モデルを引き継ぎ、現在の AI 界隈で話題になっています。アウ

Machine Power Report 編集者: Yang Wen 大型モデルや AIGC に代表される人工知能の波は、私たちの生活や働き方を静かに変えていますが、ほとんどの人はまだその使い方を知りません。そこで、直感的で興味深く簡潔な人工知能のユースケースを通じてAIの活用方法を詳しく紹介し、皆様の思考を刺激するコラム「AI in Use」を立ち上げました。また、読者が革新的な実践的な使用例を提出することも歓迎します。送信メール: content@jiqizhixin.com 過去 2 日間に画面が黒い猿によってスワイプされました。これはどれほど馬鹿げた暑さですか? Douyin、Weibo、一般アカウントを一度スワイプするだけで、国産ゲーム「Black Myth: Wukong」の話題で持ちきりとなり、公式メディアも生放送を開始しました。従業員が安心して働けるよう、直接休暇を取得する企業もあります。

人工知能は想像を超えるスピードで発展しています。 GPT-4 がマルチモーダル技術を一般に公開して以来、マルチモーダル大型モデルは急速な開発段階に入り、純粋なモデルの研究開発から垂直分野での探査と応用へと徐々に移行し、あらゆる分野に深く統合されています。インターフェイス インタラクションの分野では、Google や Apple などの国際的なテクノロジー大手が、携帯電話 AI 革命を前進させる唯一の方法とみなされている大規模なマルチモーダル UI モデルの研究開発に投資してきました。このような状況の中で、中国初の大規模UIモデルが誕生しました。 8月17日、国際エクスペリエンスデザインカンファレンス「IXDC2024」において、AI時代のデザインツールであるMotiffは、独自開発したUIマルチモーダルモデル「Motiff Model」を発表した。世界初のUIデザインツールです

2024 年 8 月 20 日、PICO は北京で新製品コミュニケーション会議を開催し、同社初の MR 複合現実オールインワン マシン PICO4Ultra を正式に発売しました。 PICO4Ultra の発売は、MR テクノロジー分野における PICO の新たな進歩を示し、より豊かでパーソナライズされた複合現実体験をユーザーにもたらします。ハードウェア レベルでは、PICO4Ultra には新しい Qualcomm Snapdragon® が搭載されていますシステム レベルでは、PICO4Ultra はパノラマ スクリーン ワークベンチを導入し、ユーザーが複数の画面を開いて配置できるようにします。
