Deng Jiang, Zhongguancun Science and Technology 부사장: 금융 시나리오에서 AI 오디오 및 비디오 기술의 실제 적용

WBOY
풀어 주다: 2023-04-12 15:34:25
앞으로
935명이 탐색했습니다.

전통적인 금융 산업은 비효율적인 운영, 열악한 위험 관리 및 통제, 높은 고객 확보 비용 등의 문제점에 직면해 있습니다. 금융과 기술의 통합을 통해 전통적인 비즈니스의 문제점과 어려움을 해결하는 것은 현재 금융산업의 혁신적 발전을 위한 중요한 지원입니다.

며칠 전 51CTO가 주최한 AISummit글로벌 인공 지능 기술 컨퍼런스에서 Deng Jiang 중관촌 과학 기술 부사장이 "AI 오디오 응용 실습" 기조 연설을 했습니다. 금융 시나리오에서의 비디오 기술' '운영'은 오디오 및 비디오 기술과 금융에 대한 기술적 응용과 사고를 응용, 기술, 역할, 가치의 세 가지 수준에서 소개합니다.

지난 3년 동안 전염병은 경제와 사회 전체에 큰 영향을 미쳤습니다. 오프라인 시나리오에 크게 의존하는 금융 비즈니스도 예외는 아닙니다.

금융 시나리오에 AI 오디오 및 비디오 기술 적용

지난 몇 년간 전염병의 맥락에서 금융 비즈니스는 큰 영향을 받았으며 국가에서도 홍보를 위해 일련의 관리 조치를 도입했습니다. 비접촉 금융 개발.

새로운 환경 요구 사항과 신기술에 따라 기존의 수동 중심 서비스 모델(오프라인 수동 중심 서비스 모델)이 AI 기반 지능형 서비스 모델(온라인 + 오프라인 전체 서비스 모델)로 반복되었습니다. ). 채널 인간-기계 시스템의 서비스 모델). 전통적인 인간 중심 서비스 모델에서는 오프라인 대면, 문자, 전화 음성, 오디오 및 비디오 및 기타 서비스 모드만 실현할 수 있으며 AI 드라이버에서는 지능형/무인 매장, 지능형 고객을 실현할 수 있습니다. 서비스, ​​지능형 IVR/아웃바운드 통화, AI 인텔리전스 비디오, AI 가상 직원 및 기타 서비스.

Deng Jiang은 원격뱅킹을 실현하기 위해 전체 기술의 발전을 이끄는 5가지 핵심 기술이 있다고 말했습니다. 5대 핵심기술에는 인공지능 기술, 실시간 컴퓨팅, 생체인식 및 신원 확인, 데이터 의사결정 및 데이터 컴퓨팅, 개인정보 보호 등이 포함된다.

구현 과정에는 3가지 핵심 알고리즘과 4가지 핵심 기술 역량이 있으며, 이는 기술 구현 과정에서 기술 요구 사항의 나머지 두 부분입니다. 세 가지 주요 AI 핵심 알고리즘: 음성 기술, 자연어 처리, 머신 비전. 4가지 핵심 기술 역량: 옴니채널 고품질 오디오 및 비디오 통신 기능, 옴니채널 SDK 패키징 및 적응 기능, 오디오 및 비디오 기반 AI 알고리즘 심층 통합 및 애플리케이션 기능, 유연하고 시각적인 비디오 서비스 시나리오 조정 기능.

금융 시나리오에서 지능형 비디오 클라우드 구축의 기술적 구현

Deng Jiang은 지능형 비디오 클라우드는 AI 인텔리전스와 RPA 프로세스 자동화를 사용하여 "인간-기계"를 구축하는 기본 비디오를 촉진하는 디지털 업그레이드라고 말했습니다. 협업 및 인간-기계 셀프 서비스의 비디오 서비스 모델입니다. 기본 클라우드 컴퓨팅 리소스의 지원을 통해 하위 계층은 ASR, TTS, NLP, OCR, 얼굴 인식, 리메이크 방지, 실시간 감지 등을 포함하여 높은 동시성과 빠른 응답을 지원하는 오디오 및 비디오 플랫폼을 구축합니다. 비즈니스 미들엔드 수준에서는 고객 프로세스 관리, 높은 동시성에서의 지능형 큐잉, 관련 정보의 통계 분석, 주문 관리 및 일련의 미들엔드 지원을 구현합니다.

Deng Jiang, Zhongguancun Science and Technology 부사장: 금융 시나리오에서 AI 오디오 및 비디오 기술의 실제 적용

프런트 엔드에서는 멀티 엔드 개입 지원 외에도 위조 신원에 대한 일련의 멀티 모달 생체 인식 확인, 클라이언트 셀프 서비스 및 고객 서비스 원격 비디오 및 현장 영상 캡쳐를 실시간으로 계산하고 처리합니다. 프런트 엔드는 재무 관리, 보험, 신탁 등 일련의 비즈니스에 대한 관련 온라인 및 오프라인 통합 프로세스 관리를 포함하는 비즈니스 시나리오 엔드입니다.

강력한 기본 기반을 바탕으로 다중 모드 신원 확인, AI 현장 비디오 서비스, AI 셀프 서비스 비디오 서비스, AI 원격 비디오 서비스, AI 지능형 오디오 및 비디오 품질의 5가지 핵심 제품을 구성했습니다. 점검. 또한 AI Video Cloud의 영상 서비스 시스템을 소개하고, 제품 시스템을 해체하고, 제품 특징과 프로세스 관리, 제품 가치 등을 소개했다.

금융 시나리오에서 AI 오디오 및 비디오 기술의 실제 적용 - 모바일 신용

전통적인 금융 신용 인터뷰에는 6가지 주요 어려움이 있습니다.

정보 섬에 직면한 인터뷰 데이터는 위험 제어 시스템과 독립적이며 기능을 완전히 활용 동적 데이터 가치, 인력 경험에 크게 의존하는 품질, 낮은 비즈니스 효율성, 지능적이거나 약한 지능적 지원, 높은 풀뿌리 압력, 낮은 효율성 적용 범위가 어렵고 비용이 많이 듭니다. 비즈니스 볼륨 병목 현상, 비즈니스 최고점 및 최저점, 동적 확장 매칭이 좋지 않습니다. 수동 샘플링 위험이 높고 수동 오프라인 샘플링 검토는 잠재적 위험이 높으며 피드백이 시기적절하지 않으며 직원 업무 압력이 높습니다. 높은.

인터뷰의 어려움을 소개한 후 Deng Jiang은 중국 은행보험감독관리위원회에서 발행한 4개 업계 '고시'를 정책 차원에서 해석했습니다. Deng Jiang은 오디오 및 비디오 흔적을 남기는 것이 은행, 신탁, 보험 및 증권 산업에서 필수 요구 사항이 되었다고 말했습니다.

Deng Jiang, Zhongguancun Science and Technology 부사장: 금융 시나리오에서 AI 오디오 및 비디오 기술의 실제 적용

Deng Jiang 씨는 연설에서 원격 화상 인터뷰, 셀프 서비스 화상 인터뷰, 계정 관리자와의 방문 인터뷰, 현장 인터뷰의 네 가지 모바일 신용 시나리오를 공유했습니다. 그는 또한 지점 카운터에서 바이오 위조 방지 방향에 대한 중관춘 과학 기술의 위험 제어 프로세스와 실제 결과, 다중 모드 바이오 위조 방지 및 보안 플랫폼에 대한 전체 프로세스 비디오를 소개했습니다.

멀티모달 생물학적 위조방지 및 보안 플랫폼은 동작, 판독 등 다양한 생활감지 방식을 지원하며, 서버의 강력한 AI 알고리즘을 활용하여 보다 정확한 식별 및 사기방지 기능을 제공합니다. 이는 액세스 레이어, 코어 레이어, 기능 레이어, 씬 레이어의 4개 레이어로 구성됩니다.

Deng Jiang, Zhongguancun Science and Technology 부사장: 금융 시나리오에서 AI 오디오 및 비디오 기술의 실제 적용

액세스 계층은 WeChat 애플릿, APP, 모바일 H5, 웹, 카메라 포트 및 타사 시스템으로 구성됩니다.

핵심 레이어에는 생체 위조, 사기 탐지, 생물학적 비교 등 세 가지 기능 모듈이 있습니다. 실시간 위조 방지 기능은 기본 및 강화된 위조 방지 탐지와 행동 위험 탐지로 구성됩니다. 기본 위조 방지 탐지에는 얼굴 제시 공격, 성문 제시 공격, 링크 하이재킹 탐지가 포함됩니다. 위조 감지, 행동 위험 모니터링에는 얼굴 자세 감지, 입술 언어 인식, 오디오 및 비디오 동기화 감지, 폐색 의미 분할이 포함됩니다. 사기 탐지에는 신분증 위조 탐지, 서명 및 인감 위조 탐지, 인물 배경 유사 탐지, 성문 갱 탐지 등이 포함됩니다. 생물학적 비교에는 적대적 샘플 강화 학습, 성문 비교 검색 및 얼굴 비교 검색이 포함됩니다.

기능 계층은 검증 역량 평가, 행동 위험 평가, 정책 관리, 제3자 데이터 액세스, 연합 학습, 능동적 공격 차단, 암호화된 저장, 무의미한 등록, 무의미한 기록, 무의미한 새로 고침, 수명 주기 관리, 12개로 구성됩니다. 기능 구현을 위해 보안 감사를 포함한 모듈이 구현됩니다.

시나리오 레이어에 포함된 비즈니스 시나리오에는 다차원 실명 인증, 신용 연장, 직원 규정 준수 감독, 중개 대리인 탐지, 전자 검토 갱 탐지, CC 불만 추적, 사무실 데스크톱 보안 및 주요 고객 액세스가 포함됩니다. .

다중 모드 생물학적 위조 방지 플랫폼에 대한 심층 분석 후, AI 시각 및 음성 품질의 도움을 받아 AI 지능형 오디오 및 비디오 품질 검사 + 수동 현장 검사 및 검토의 플랫폼 기능을 설명합니다. 검사 기술, 영상 서비스의 실시간 품질 관리 검사, 실시간 수정(문자 수정, 음성 수정), 사용자 및 비즈니스 관리자에게 실시간 알림, 1차 합격률 대폭 향상, 높은 2차 비용 문제 방지 사용자 등록 및 열악한 경험과 관련된 주요 기술에는 지능형 이미지 인식, 지능형 생체 인식, 지능형 음성 인식, 지능형 동작 인식, 오디오 및 비디오 동기화 감지 등이 포함됩니다.

지능형 수집 및 지능형 재방문 도입 시 지능형 수집은 완전 자동화된 수집 작업 및 의인화된 의사소통을 실현할 수 있습니다. 음성 기술은 다양한 연체 단계 및 고객 유형에 맞게 유연하게 맞춤화될 수 있으며 표준 음성 프로세스는 수동 수집 음성의 부정확성을 방지할 수 있습니다. 강령으로 인해 발생하는 규정 준수 위험 및 불만 사항. 지능적인 재방문은 높은 통화 효율성을 달성할 수 있으며, 배경 통계를 통해 고객 도달률을 이해하고, 고객 경험에 영향을 주지 않고 열정적으로 소통할 수 있습니다.

AI 지능형 영상 클라우드에 관련된 기능과 기술을 분석한 후, AI 지능형 영상 클라우드 관련 사례를 공유했습니다. 자세한 사례는 공식 홈페이지 영상 재생을 참고해주세요.

결론

AI 오디오 및 비디오 기술에는 얼굴, 성문, 입술 읽기, 음성 합성 및 기타 기술이든 장면에 심층적인 장면 사용자 정의가 있습니다. 기술 회사로서 기술 역량을 연마하는 것 외에도 심층적인 비즈니스 시나리오, 고객 중심, 고객 요구 이해, 고객 비즈니스의 실제 문제점 해결 및 도구 활용 능력에 더 중점을 둡니다. 기술의 미래는 회사의 더 높은 요구 사항입니다. 궁극적으로 금융 시나리오에 기술을 심층적으로 적용함으로써 금융사업 전체의 수준이 향상되고, 금융사업 전체의 대규모 발전의 경계가 넓어지게 될 것입니다.

Deng Jiang, Zhongguancun Science and Technology 부사장: 금융 시나리오에서 AI 오디오 및 비디오 기술의 실제 적용

컨퍼런스 연설 재생과 PPT가 현재 온라인에 있습니다. 공식 웹사이트로 이동하여 흥미로운 콘텐츠를 확인하세요 --> ​AISummit 글로벌 인공 지능 기술 컨퍼런스 공식 웹사이트​

위 내용은 Deng Jiang, Zhongguancun Science and Technology 부사장: 금융 시나리오에서 AI 오디오 및 비디오 기술의 실제 적용의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

원천:51cto.com
본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.
최신 이슈
인기 튜토리얼
더>
최신 다운로드
더>
웹 효과
웹사이트 소스 코드
웹사이트 자료
프론트엔드 템플릿