negara saya telah mencapai kemajuan penting dalam merumuskan piawaian suara masa nyata AVS3, dan penyelesaian Tencent telah dipilih-industri IT-php.cn

negara saya telah mencapai kemajuan penting dalam merumuskan piawaian suara masa nyata AVS3, dan penyelesaian Tencent telah dipilih

王林

Lepaskan： 2023-12-15 10:57:10

ke hadapan

1125 orang telah melayarinya

Menurut berita rasmi daripada Perikatan Kecerdasan Buatan Generasi Baharu, piawaian pengekodan pertuturan masa nyata AVS3P10 telah mencapai kemajuan penting baru-baru ini Berita itu diterbitkan di tapak ini pada 14 Disember.

Pada 14 Disember 2023, AVS Working ke-87. Mesyuarat Kumpulan dibuka di Chengdu. Pada mesyuarat itu, "Pengekodan Media Pintar Bahagian 10 Ucapan Masa Nyata" (selepas ini dirujuk sebagai AVS3P10) WD 1.0 telah disemak oleh mesyuarat pleno Penyelesaian teknikal yang dikemukakan oleh Tencent telah dipilih sebagai garis asas RM0 ucapan masa nyata AVS3P10; pengekodan.

negara saya telah mencapai kemajuan penting dalam merumuskan piawaian suara masa nyata AVS3, dan penyelesaian Tencent telah dipilih

Teknologi komunikasi suara masa nyata (Nota di tapak ini: RTC, Komunikasi Masa Nyata) telah digunakan secara meluas dalam pejabat kerjasama, hiburan interaktif, rangkaian sosial dan bidang lain. Senario aplikasi yang pelbagai dan kaya yang dinyatakan di atas menimbulkan pelbagai cabaran teknikal kepada teknologi komunikasi suara masa nyata Antaranya, pengekodan suara berkualiti tinggi, kependaman rendah, jalur lebar rendah dan rintangan tinggi adalah bahagian yang sangat penting.

Pada kadar kod 16-20kbps, pengekod pertuturan tradisional seperti piawaian AVS dan ITU-T boleh menghasilkan pertuturan jalur lebar berkualiti tinggi. Pada 30-35kbps, mereka boleh menjana suara jalur ultra lebar dan juga jalur penuh berkualiti tinggi. Walau bagaimanapun, apabila kadar bit dikurangkan lagi (contohnya, di bawah 10kbps), kualiti pemulihan pengekod pertuturan tradisional berkurangan dengan ketara, yang memberi kesan kepada pengalaman pengguna

Berdasarkan permintaan aplikasi di atas, pada AVS ke-84 Persidangan pada bulan Mac tahun ini, Tencent mencadangkan untuk melancarkan projek sistem suara berkadar bit rendah dan berkualiti tinggi untuk senario komunikasi suara masa nyata dalam kumpulan audio AVS. Selepas analisis permintaan, pada mesyuarat AVS ke-85, AVS secara rasmi memulakan projek pengekodan pertuturan masa nyata AV3P10 dan mengeluarkan permintaan teknikal melalui kumpulan audio AVS. Projek pengekodan pertuturan masa nyata AVS3P10 akan dipromosikan dan diselenggara oleh Xiao Wei dari Tencent Conference Teana Lab.

Pada mesyuarat AVS ke-86, kumpulan audio menyemak cadangan M7886 "Pelan Teknikal Calon Model Rujukan Pengekodan Ucapan AVS3P10" yang dikemukakan oleh Tencent Conference Tianlai Laboratory

Semakan mendapati pelan tersebut mempunyai empat ciri berikut:

menyepadukan secara mendalam teknologi kecerdasan buatan seperti pemprosesan isyarat klasik dan teknologi rangkaian saraf dalam, dan dimiliki oleh AI Codec
menyokong kadar bit rendah, pengekodan berkualiti tinggi, pengekodan dan penyahkodan masa nyata dan pengekodan berbilang kadar
adalah berdasarkan pengekodan sub-jalur Dan seni bina pengekodan berbilang mod, isyarat frekuensi rendah menggunakan rangkaian saraf dalam untuk mengekstrak ciri, isyarat frekuensi tinggi menggunakan skema pengembangan jalur frekuensi untuk mengekstrak ciri, dan pemampatan ciri diselesaikan dengan menggabungkan skalar kuantisasi dan pengekodan entropi;
mempunyai ciri teknikal seni bina rangkaian saraf pengekodan terbuka, dan Atas dasar memastikan keserasian ke hadapan aliran kod, rangkaian saraf pengekodan boleh diubah suai dan dioptimumkan.

Pada 1 November tahun ini, Persidangan Tencent Tianbai Lab1 0 yang difailkan di China s Technology Standardization Institute dan Huawei Subjective ujian dan pengesahan silang telah dijalankan masing-masing. Pengesahan silang berusaha untuk menjadi komprehensif, berdasarkan sistem penilaian kualiti subjektif ITU-T P.800 DCR Ujian subjektif meliputi suara tulen, suara kehilangan paket, suara campuran dan senario lain di bawah lebar jalur yang berbeza, dan buat kali pertama, senario ujian diproses 3A diperkenalkan ke dalam pengekodan sumber Dalam ujian mesin, untuk menguji prestasi teknologi AI Codec generasi baharu dalam hampir senario sebenar.

Dalam senario ujian di atas,

AVS3P10 RM0 mempunyai kelebihan kualiti yang jelas. Keputusan ujian subjektif menunjukkan bahawa AVS3P10 RM0 telah mencapai mata MOS lebih daripada 4.0 dalam berbilang senario ujian utama seperti jalur lebar dan jalur ultra lebar, menunjukkan kelebihan yang jelas, dengan kadar bit terendah mencapai 5.9kbps. AVS3P10 RM0 menggunakan teknologi rangkaian saraf dalam dan mempunyai keupayaan kerosakan kehilangan paketnya sendiri, yang meningkatkan kualiti pengekod secara berkesan apabila rangkaian lemah.

Selain itu, dalam eksperimen penilaian kualiti objektif ITU-T P.863, AVS3P10 RM0 juga menunjukkan kelebihan yang ketara. Pertama sekali, dalam kesemua lapan kadar bit ujian, nilai MOS AVS3P10 RM0 melebihi 4.0, mencapai maksimum 4.45. Kualiti AVS3P10 RM0 adalah setanding dengan prestasi pengekod pemprosesan isyarat tradisional seperti OPUS dan EVS pada kadar bit sederhana dan tinggi, mencapai kualiti gred pembawa. Dalam bidang codec AI, AVS3P10 RM0 mempunyai kelebihan kualiti lebih daripada 0.6MOS pada kadar bit yang sama. Keputusan ujian di atas menunjukkan bahawa AVS3P10 RM0 mewakili tahap tertinggi codec AI semasa

Perikatan Kecerdasan Buatan Generasi Baharu menyatakan bahawa AVS3P10 pengekodan pertuturan masa nyata, sebagai generasi baharu piawaian teknologi codec pertuturan, merupakan tambahan penting kepada Siri piawaian AVS .

Pada masa hadapan, projek pengekodan pertuturan masa nyata AVS3P10 akan dipromosikan mengikut pelan yang telah ditetapkan, Ia dijangka menyelesaikan kerja penyeragaman pada pertengahan 2024.

Pernyataan Pengiklanan: Artikel ini mengandungi pautan lompat luaran (termasuk tetapi tidak terhad kepada hiperpautan, kod QR, kata laluan, dll.), yang direka untuk memberikan lebih banyak maklumat dan menjimatkan masa pemeriksaan. Keputusan pautan adalah untuk rujukan sahaja. Sila ambil perhatian bahawa semua artikel di laman web ini mengandungi pernyataan ini

Atas ialah kandungan terperinci negara saya telah mencapai kemajuan penting dalam merumuskan piawaian suara masa nyata AVS3, dan penyelesaian Tencent telah dipilih. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!