中関村科学技術副院長の鄧江氏: 金融シナリオにおける AI オーディオおよびビデオ技術の実用化-AI-php.cn

従来の金融業界は、非効率な業務運営、貧弱なリスク管理と制御、高額な顧客獲得コストなどの問題点に直面しています。金融とテクノロジーの統合を通じて従来のビジネスの問題点や困難を解決することは、現在の金融業界の革新的な発展にとって重要なサポートです。

最近、51CTO が主催する AISummit Global Artificial Intelligence Technology Conference において、中関村科技副院長のDeng Jiang氏は「金融シナリオにおけるAIオーディオ・ビデオ技術の実用化」という基調講演を行い、アプリケーション、テクノロジー、金融の3つのレベルからオーディオ・ビデオ技術と金融の技術応用と考え方を紹介した。役割と価値。

過去 3 年間、疫病は経済と社会全体に大きな影響を与えました。オフラインシナリオに大きく依存する金融ビジネスも例外ではありません。

金融シナリオにおける AI オーディオおよびビデオテクノロジーの適用

過去数年の感染症の流行に伴い、金融ビジネスはその結果、同国は非接触型金融の発展を促進するための一連の管理措置を導入した。

新しい環境の要件と新しいテクノロジーに基づいて、従来の人間主導のサービスモデル (オフライン人間主導のサービスモデル) が AI 主導のインテリジェントサービスモデルに反復されます (オンラインおよびオフラインのオムニチャネルヒューマンマシンシステムのサービスモデル)。従来の人間主導のサービスモデルでは、オフラインの対面、テキスト、電話の音声、オーディオとビデオなどのサービスモードのみが実現できますが、AIドライバーの下では、インテリジェント/無人コンセント、インテリジェントな顧客を実現できます。サービス、インテリジェント IVR/アウトバウンドコール、AI インテリジェンス、ビデオ、AI 仮想従業員、その他のサービス。

Deng Jiang 氏は、リモートバンキングを実現するために、テクノロジー全体の進歩を推進する 5 つのコアテクノロジーがあると述べました。 5 つのコア技術には、人工知能技術、リアルタイムコンピューティング、生体認証と本人確認、データ意思決定とデータコンピューティング、プライバシー保護が含まれます。

実装プロセスには、3 つのコアアルゴリズムと 4 つのコア技術機能があり、これらはテクノロジ実装プロセスにおける技術ニーズの残りの 2 つの部分です。 3 つの主要な AI コアアルゴリズム: 音声テクノロジー、自然言語処理、マシンビジョン。 4 つのコア技術機能: オムニチャネルの高品質オーディオおよびビデオ通信機能、オムニチャネル SDK パッケージ化および適応機能、オーディオおよびビデオベースの AI アルゴリズムの緊密な統合およびアプリケーション機能、および柔軟でビジュアルなビデオサービスシーンオーケストレーション機能。

金融シナリオにおけるインテリジェントビデオクラウド構築の技術的実践運用

Deng Jiang氏は、インテリジェントビデオクラウドは基本的なビデオデジタルを促進する方法であると述べました。 AI インテリジェンスと RPA プロセス自動化を使用してアップグレードし、「人間と機械のコラボレーションと人間と機械のセルフサービス」の新しいビデオサービスモデルを構築します。基本的なクラウドコンピューティングリソースのサポートにより、最下層は、ASR、TTS、NLP、OCR、顔認識、アンチリメイク、ライブ検出などを含む、高い同時実行性と高速応答をサポートするオーディオおよびビデオプラットフォームを構築します。ビジネスミドルエンドレベルでは、顧客プロセス管理、高い同時実行性でのインテリジェントなキューイング、関連情報の統計分析、注文管理、および一連のミドルエンドサポートを実装します。

中関村科学技術副院長の鄧江氏: 金融シナリオにおける AI オーディオおよびビデオ技術の実用化

# フロントエンドでは、マルチエンド介入のサポートに加えて、一連のマルチモーダル偽造 ID の生体認証検証、クライアントのセルフサービスおよび顧客サービスのリモートビデオ、およびオンサイトビデオのリアルタイム計算とキャプチャ。フロントエンドはビジネスシナリオエンドであり、財務管理、保険、信託などの一連のビジネスに関連するオンラインおよびオフラインの統合プロセス管理が含まれます。

強力な基礎基盤に基づいて、マルチモーダル本人確認、AI オンサイトビデオサービス、AI セルフサービスビデオサービス、AI リモートビデオサービスの 5 つのコア製品が形成されました。、AI インテリジェントなオーディオとビデオの品質チェック。また、AI Video Cloud のビデオサービスシステムを紹介し、製品システムを解体し、製品の機能、プロセス管理、製品価値を紹介しました。

金融シナリオにおける AI オーディオおよびビデオテクノロジの実用的な適用 - モバイルクレジット

従来の金融信用調査には 6 つの大きな問題があります:

情報サイロに直面し、インタビューデータはリスク管理システムから独立しており、その動的なデータ価値が十分に活用されていない、完全に人工的に駆動されたモデル、品質は担当者の経験に大きく依存し、不均一である、ビジネス効率が低い、インテリジェンスがない、またはインテリジェンスが弱い補助的、草の根の圧力が高く、効率が低い; ビジネス展示チャネルが単一で、オンサイトインタビューとインタビューモードをカバーするのが難しく、コストが高い; ビジネス量のボトルネック、ビジネスのピークおよびトラフ、動的拡張のマッチングが不十分、手動サンプリングのリスクが高く、手動によるオフラインサンプリングレビューの可能性があるリスクが高く、フィードバックが十分にタイムリーではなく、担当者は高圧の下で働いています。

鄧江氏は取材の難しさを紹介した後、中国銀行保険監督管理委員会が発行した4つの業界「通知」を政策レベルから解釈した。鄧江氏は、銀行、信託、保険、証券業界では音声とビデオの痕跡を残すことが必須要件になっていると述べた。

中関村科学技術副院長の鄧江氏: 金融シナリオにおける AI オーディオおよびビデオ技術の実用化

鄧江氏のスピーチでは、モバイルクレジットの 4 つのシナリオを共有しました: リモートビデオインタビュー、セルフサービスビデオインタビュー、アカウントマネージャーとの戸別訪問インタビュー、およびアウトレットカウンターでのオンサイトインタビューが実施され、ビデオリスク管理プロセス全体とバイオ偽造防止の方向における中関村科学技術の実践結果が報告されました。＃、つまりマルチモーダルバイオ偽造防止プラットフォームとセキュリティプラットフォームが同時に導入されました。

マルチモーダルな生物学的偽造防止およびセキュリティプラットフォームは、動作や読み取りなどの複数の生体検出方法をサポートし、サーバー上の強力な AI アルゴリズムを使用して、より正確なセキュリティを提供します。不正行為機能については、そのプラットフォームはアクセス層、コア層、機能層、シナリオ層の 4 層に分かれています。

中関村科学技術副院長の鄧江氏: 金融シナリオにおける AI オーディオおよびビデオ技術の実用化

アクセス層は、WeChat アプレット、APP、モバイル H5、Web、カメラポート、およびサードパーティシステムで構成されます。

コア層には、ライブ偽造、不正検出、生物学的比較を含む 3 つの機能モジュールがあります。ライブ偽造機能は、基本および強化された偽造防止検出と行動リスク検出で構成され、基本的な偽造防止検出には顔提示攻撃、声紋提示攻撃、およびリンクハイジャック検出が含まれ、拡張偽造防止検出には音声移行合成検出、ディープ偽造検出が含まれます。偽造品の検出、行動リスクのモニタリングには、顔の姿勢検出、口唇言語認識、オーディオとビデオの同期検出、オクルージョンセマンティックセグメンテーションが含まれます。不正検出には、ID カード偽造検出、署名および印鑑偽造検出、肖像画の背景の類似性、声紋の集団検出が含まれます。生物学的比較には、敵対的サンプル強化学習、声紋比較検索、および顔比較検索が含まれます。

機能層は、検証能力評価、行動リスク評価、ポリシー管理、サードパーティデータアクセス、フェデレーテッドラーニング、アクティブな攻撃阻止、暗号化ストレージ、センスレス登録、センスレス記録、機能の実装には、センサーレスリフレッシュ、ライフサイクル管理、セキュリティ監査など12のモジュールを使用する。

シナリオ層に含まれるビジネスシナリオには、多次元の実名認証、信用付与、従業員コンプライアンスの監督、仲介エージェントの検出、電子レビューギャングの検出、CC 苦情追跡、オフィスのデスクトップセキュリティ、大企業の顧客がオンラインに来ます。

マルチモーダル生物学的偽造防止プラットフォームを詳細に分析した後、AI インテリジェントなオーディオとビデオの品質検査と手動のスポット検査とレビューのプラットフォーム機能について説明しました。 AI視覚および音声品質検査技術の助けを借りて、ビデオサービスで、リアルタイム品質検査、リアルタイム修正（テキスト修正、音声修正）、ユーザーおよび経営者へのリアルタイムリマインダーを提供し、初回合格率を大幅に向上させます二次登録のコストが高く、ユーザーのエクスペリエンスが劣るという問題を回避するために、関連する主なテクノロジーには、インテリジェント画像認識、インテリジェント生体認証識別、インテリジェント音声認識、インテリジェント動作認識、オーディオとビデオの同期検出などが含まれます。

インテリジェントな回収とインテリジェントな再訪問の導入では、インテリジェントな回収により、完全に自動化された回収作業と擬人化されたコミュニケーションが実現できます。音声は、さまざまな延滞段階や顧客のタイプに合わせて柔軟にカスタマイズでき、標準的な音声プロセスにより手動での音声処理を回避できます。労働不規則な収集手法によって引き起こされるコンプライアンスのリスクと苦情。インテリジェントな再訪問により、高い通話効率を実現し、バックグラウンド統計を通じて顧客到達率を把握し、顧客エクスペリエンスに影響を与えることなく熱意と満足度を高め、コストを削減し、効率を向上させることができます。

AIインテリジェントビデオクラウドに関わる機能と技術を分析した後、AIインテリジェントビデオクラウドの関連事例を共有しました。公式ウェブサイトでビデオ再生をご覧ください。事件の詳細については。

結論

AI オーディオおよびビデオ技術には、顔、声紋、読唇術、音声合成などがあります。 -シーン内の深度シーンのカスタマイズ。テクノロジー企業としては、技術力を磨くことに加えて、綿密なビジネスシナリオ、顧客中心であり、顧客のニーズを理解し、顧客のビジネスにおける真の問題点を解決し、ツールを上手に活用できることが重要です。はテクノロジーの未来であり、企業のより高度な要件です。最終的には、金融シナリオにおけるテクノロジーの徹底的な適用を通じて、金融ビジネス全体のレベルが向上し、金融ビジネス全体の大規模開発の境界が広がります。

中関村科学技術副院長の鄧江氏: 金融シナリオにおける AI オーディオおよびビデオ技術の実用化