6월 27일 이 사이트의 소식에 따르면, Tencent는 오늘 회사가 주도하는 차세대 실시간 음성 코딩 산업 표준 AVS3P10이 최종 확정되었으며 곧 공식 출시될 것이라고 발표했습니다. 이번에 AVS 오디오 그룹 AVS3P10 표준은 Tencent의 솔루션을 채택하고 Tencent Conference가 자체 개발한 최초의 신경망 음성 코덱 Penguins AI 음성 엔진을 기반으로 하여 취약한 네트워크 환경에서 통화 품질을 향상시킬 수 있습니다.
텐센트는 이것이 세계 최초로 인공지능을 체계적으로 도입하고, 낮은 비트 전송률에서 고품질 음성 코딩 표준을 구현했으며, 그 성능이 세계 최고 수준에 도달했다고 밝혔습니다. 인코딩 비트율의 1/3만으로 기존 주류 표준과 동일한 선명한 음질을 구현할 수 있습니다. "네트워크 카드가 2G이더라도 원활하게 회의를 진행할 수 있습니다."이 표준은 AVS 오디오 그룹의 여러 구성원의 공동 기여를 통해 Tencent에서 시작, 홍보 및 유지 관리되었습니다. "향후에는 온라인 회의, 음성 통화 등 실시간 오디오 시나리오에 필요한 대역폭 요구 사항이 크게 줄어들 것입니다. 엘리베이터, 지하실, 터널 등 네트워크가 열악한 환경에서도 선명하고 부드러운 음성 통화를 구현할 수 있습니다."
보고에 따르면 제한된 대역폭 조건에서 수신기에 고품질 사운드를 전달하려면 원본 데이터를 압축하고 중복 정보를 제거하는 음성 코딩 기술이 핵심입니다. 그러나 EVS, OPUS 등 기존 주류 오디오 코딩 및 디코딩 표준에 따르면 비트 전송률이 10kbps 미만으로 떨어지면 음성 품질이 크게 떨어지며 사용자 경험에 영향을 미칩니다.이 문제를 해결하기 위해 Tencent Conference Tianlai Lab과 Tencent AI Lab은 Tencent 최초의 신경망 음성 코덱인 Penguins를 독립적으로 개발했습니다.
구체적으로 Penguins는 AI를 기존 기술과 통합하여 기존 Shannon의 법칙의 성능 한계를 깨고 빅 데이터를 도입하고 제어 가능한 컴퓨팅 성능 증분에 따라 새로운 성능 상한을 제공함으로써 차세대 통신 시스템, 특히 이를 지원하는 소스입니다. 새로운 기술 기반과 방법론을 제공하는 인코더 부분입니다. AI 음성 신호 모델링을 통해 핵심 특징 매개변수 인코딩을 추출한 후 딥러닝 네트워크의 도움으로 음성의 미묘한 구조를 예측 및 재구성하여 최종적으로 현실적인 오디오 파형을 생성합니다.
여러 테스트에 따르면 Tencent가 제출한 AVS3P10 표준은 6kbps에서 고품질 음성 통신을 달성하며 "2G" 네트워크에서도 명확한 통화를 달성할 수 있으며 주관적인 품질은 원본 참조 신호에 매우 가깝습니다. 20kbps 품질의 국제 주류 OPUS 표준입니다. 동시에 주관적 품질을 중간 및 높은 비트 전송률의 기존 인코딩과 비교할 때 인코딩 효율성이 200-300% 증가합니다.
2021년부터 Penguins 오디오 인코더는 Tencent 회의 운전 모드, 약한 네트워크 모드 및 QQ 음성 통화 등의 대규모 애플리케이션에 적용되었습니다.
2023년 3월 Tencent 팀은 AVS 오디오 그룹의 표준, 즉 AVS3P10 실시간 음성 코딩 표준 제정을 제안하고 참여했습니다. 이후 Tencent는 Penguins를 기반으로 한 후보 기술을 제출했으며 AVS 오디오 그룹의 교차 검증을 거쳐 채택되었습니다. 2024년 6월 AVS3P10 실시간 음성 코딩 표준은 공식적으로 표준화 작업을 완료하고 공개 발표 단계에 들어갔습니다.
이 사이트의 참고 사항: 2002년 6월 우리나라에 AVS 실무 그룹이 설립된 이후 수천 명의 사람들이 10년 이상 팀 노력을 기울인 끝에 우리나라에서 독립적인 지적 재산권을 가진 AVS가 탄생했습니다. AVS3은 8K 및 5G 산업용 애플리케이션을 위해 세계 최초로 출시된 비디오 인코딩 표준입니다.
AVS는 AVS4의 표준 공식화를 시작했으며 AVS 회원사에 AVS의 차세대 표준 개발을 지속적으로 지원하도록 요청합니다. 다양한 제조업체가 힘을 합쳐 기술 표준을 공동으로 구현하고 글로벌 배포를 촉진할 것입니다.
위 내용은 엘리베이터와 지하실에서의 통화는 원활합니다. Tencent는 곧 출시될 차세대 실시간 음성 코딩 산업 표준인 AVS3P10을 선도합니다.의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!