Chuang/Shenzhen Business Daily記者Chen Shuを読む
6月1日、Alibaba CloudはTongyiラージモデルの進捗を発表し、オーディオとビデオコンテンツに焦点を当てた新しいAI製品「Tongyi Listening」が正式にリリースされ、中国で公開テストが公開された最初のラージモデルアプリケーション製品となった。
Tongyi Tingwu は、Tongyi Qianwen の大規模モデルの理解および要約機能に接続されており、仕事や勉強中のユーザーにとって強力な AI アシスタントとなり、音声およびビデオ コンテンツの文字起こし、検索、要約、要約を効率的に完了するのに役立ちます。大きなモデルを使用して自動的にメモを取ったり、インタビューを整理したり、PPT を抽出したりするなど、いつでもどこでも整理できます。パブリック ベータ期間中、ユーザーは 100 時間以上の聞き取りのための無料の文字起こし時間を受け取ることができます。
「別の方法で、オーディオとビデオを簡単に読み取り、整理し、共有することができます。」 Alibaba Cloud CTO Zhou Jingren 氏は、Tingwu が知識の付加価値の高いオーディオとビデオのコンテンツ シナリオを対象とした作業学習 AI アシスタントであると紹介しました。会議、授業、面接、トレーニング、インタビュー、生放送、ビデオの視聴、ポッドキャストの視聴など、大規模なモデルなどの最新の AI テクノロジーを通じて知識を迅速に洗練し、沈殿させることができます。
[caption id="attachment_3846381" align="alignnone" width="1000"]
Tongyi Listening は、音声とビデオの全文要約、章の要約、スピーチの要約を自動的に生成できます[/caption]
Tingwu は、音声やビデオからグラフィックスやテキストへの知識伝達の効率を包括的に向上させる、十数個の人工知能機能を含むライブ デモンストレーションを披露しました。 「優れた聴覚」に加えて、高精度で会議記録を生成し、異なる発言者を区別することができます。この AI アシスタントは「非常に知覚的」でもあります。大型モデルは、音声とビデオを 1 秒でチャプターに分割し、概要、要約、および要約を作成できます。各講演者の全文、視点、焦点とやるべきことの整理。ワンクリックでのPPTの抽出、複数の音声・動画コンテンツに対するAI質問、特定段落の要約などの機能を含む大規模なモデルが近い将来リリースされる予定だ。
[caption id="attachment_3846394" align="alignnone" width="736"]
Tongyi Tingwu Chrome プラグインは、近い将来、すべてのユーザーがダウンロードできるようになります[/caption]
一部のニッチなシナリオ向けに、AudioWu は多くの「お宝機能」も設定しています。Chrome プラグインを開くと、外国語学習者や聴覚障害者は、バイリンガルのフローティング字幕バーを使用して、いつでもどこでも字幕なしでビデオを視聴できます。スケジュールが合わない場合、ウー氏の話を聞いて専門家の「会議の代役」になることもできます AI が会議を録音し、音声がミュートになっているときに重要なポイントを整理できます 書き起こし結果は字幕ファイルとしてダウンロードしてビデオを容易にすることができますニューメディア専門家によるポストプロダクション ウー氏が企画した Q&A のレビュー これにより、記者、アナリスト、弁護士、人事、その他のグループがインタビューをより効率的に企画できるようになります。
Tingwu は Alibaba Cloud Disk に接続されており、クラウド ディスク上のオーディオおよびビデオ コンテンツをワンクリックで転写できます。パブリック ベータ期間中に登録した Tingwu ユーザーには、より大きな Alibaba Cloud Disk ストレージ スペースも提供され、オンラインでも利用できます動画再生時に字幕を自動生成することも可能です。
Zhou Jingren 氏は、Tingwu がアリババの最先端の音声および言語テクノロジーを統合していると紹介しました。アリババの新世代産業グレード音声認識モデルが組み込まれており、認識精度は複数の権威ある中国データセットの中でトップに位置し、自社開発の音声セマンティクスマルチモーダル話者アルゴリズムを統合し、より多くの場面で役割を区別できます。 Tongyi Qianwen の大規模モデルにアクセスすると、数万語の音声およびビデオ コンテンツを要約することができ、事実の正確さと重要なポイントの完全性の点で国内をリードし、全体にわたる正確な質疑応答の理解をサポートします。複数のオーディオおよびビデオ コンテンツ。
査読者: タン・ルガン
以上が【原文】大きなモデルを使って自動的にメモを取ったり、PPTを抽出したり、インタビューを整理したりする Alibaba Cloudの新AI製品「Tongyi Listening」が公開テスト公開の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。