


Kekuatan teknikal Huoshan Voice TTS telah diperakui oleh Pusat Pemeriksaan dan Kuarantin Kebangsaan, dengan skor MOS setinggi 4.64
Beberapa hari lalu, produk sintesis pertuturan Enjin Gunung Berapi menerima Sijil Pemeriksaan dan Pengujian Dipertingkatkan Sintesis Pertuturan yang dikeluarkan oleh Pusat Pemeriksaan dan Pengujian Kualiti Produk Ucapan dan Pengiktirafan Imej (selepas ini dirujuk sebagai "Pusat Pemeriksaan Kebangsaan AI"). Keperluan asas dan keperluan lanjutan untuk sintesis pertuturan telah mencapai standard tahap tertinggi Pusat Pemeriksaan Kebangsaan AI. Penilaian ini dijalankan daripada dimensi Cina Mandarin, berbilang dialek, berbilang bahasa, bahasa campuran, berbilang timbre dan pemperibadian Pasukan sokongan teknikal produk - Pasukan Suara Gunung Berapi menyediakan perpustakaan bunyi yang kaya, timbrenya MOS Skor tertinggi boleh mencapai 4.64 mata, yang merupakan tahap peneraju industri.
Sebagai yang pertama dan satu-satunya sistem pemeriksaan kualiti produk suara dan imej peringkat kebangsaan dalam bidang kecerdasan buatan dalam saya agensi Pemeriksaan dan ujian negara , Pusat Pemeriksaan Kebangsaan AI telah komited untuk mempromosikan pembangunan sihat industri suara pintar. Mendapatkan pensijilan berwibawa daripada Pusat Pemeriksaan Kebangsaan AI kali ini juga menunjukkan sepenuhnya bahawa keupayaan teknologi sintesis pertuturan Huoshan Voice telah mencapai tahap peneraju industri.
Rasakan kesan sintesis pertuturan gunung berapi: https://www.php . cn/link/8e0ce414531179ae9b7f60e20351ee8b
Pengalaman yang lebih baik: > https://www.php.cn/link/a1ada9947e0d683b4625f94c74104d73
Sejak sekian lama, Huoshan Voice telah menyasarkan saluran perniagaan utama Bystedance dan industri Volcano Engine ToB dan senario inovatif menyediakan keupayaan teknologi suara AI yang terkemuka dalam industri dan penyelesaian produk suara tindanan penuh yang sangat baik. Pada masa ini, pengecaman pertuturan dan sintesis pertuturan pasukan meliputi pelbagai bahasa dan dialek, meliputi audio dan video, bacaan audio, interaksi suara, permainan, pengiklanan dan senario aplikasi lain, dan menyediakan perkhidmatan untuk Douyin, Jianying, Feishu, Novel Tomato, Pico, dsb. Perniagaan teras menyediakan keupayaan suara terkemuka.
Difahamkan bahawa produk sintesis pertuturan Enjin Volcano yang menyertai pertandingan ini dibangunkan secara bebas oleh pasukan Volcano Voice dan menggunakan teknologi rangkaian neural generatif terkemuka industri . Ia terutamanya terdiri daripada Ia terdiri daripada tiga modul utama: analisis teks hadapan, model akustik dan vocoder Pengenalan khusus adalah seperti berikut:
- Teks hadapan. analisis: terutamanya bertanggungjawab untuk kebolehfahaman, seperti penyusunan teks (contohnya, Tukar nombor kepada bacaan tahun, bacaan nombor, dll.), penukaran sebutan aksara (seperti tatatanda fonetik Cina, terutamanya untuk menyelesaikan masalah aksara berbilang fonetik), serta pembahagian perkataan dan ramalan irama, dsb. Pada masa ini, pasukan Huoshan Voice bergantung pada model berbilang tugas dan penyusunan rangkaian saraf untuk menyokong 12 bahasa minor arus perdana pada masa yang sama, dengan hasil yang luar biasa.
- Model akustik: Terutamanya bertanggungjawab untuk pemodelan daripada ciri linguistik kepada ciri akustik. Data menunjukkan bahawa kadar ketepatan bahagian belakang TTS Suara Huoshan boleh mencapai 99.90%. Pada masa yang sama, model ini juga boleh menyokong kawalan halus ke atas pelbagai emosi dan gaya, pemindahan gaya antara timbre yang berbeza, dan mencapai kesan sintesis berbilang bahasa hanya menggunakan data latihan dalam satu bahasa.
- Modul vokoder: Terutamanya bertanggungjawab untuk memodelkan ciri akustik kepada isyarat audio. Kini pasukan Volcano Voice telah membangunkan sendiri vocoder berdasarkan pemodelan rangkaian neural lawan Ketepatannya boleh mencapai 99.95%. Bergantung pada reka bentuk model ringan dan pengoptimuman kejuruteraan, kadar masa nyata dalam awan boleh mencapai lebih daripada satu seratus kali.
Pasukan Suara Gunung Berapi Berbanding dengan TTS tradisional, ia boleh menghasilkan semula butiran seperti zarah modal, bunyi penyedutan, jeda semasa teragak-agak dan pemanjangan sebutan, dan hanya. memerlukan perpustakaan bunyi konvensional 1/4 data. Selain itu, "teknologi pembiakan bunyi" yang sebelum ini popular di Internet turut dibangunkan oleh pasukan Volcano Voice. Berbeza daripada keperluan ambang tinggi teknologi sintesis pertuturan tradisional untuk data, teknologi pembiakan timbre suara Volcano hanya memerlukan 0.3% daripada volum data kaedah tradisional Orang biasa boleh bekerja dalam persekitaran yang agak tenang . Rakaman dalam persekitaran terbuka selama lebih daripada 2 minit boleh memenuhi piawaian pemodelan ruang timbre dan menjana model AI bagi timbre eksklusif, yang mudah dan cekap. Pada masa ini, Huoshan Voice akan membawakan keupayaan teknologi pertuturannya yang telah diasah selama bertahun-tahun ke pasaran dan membukanya kepada syarikat luar melalui enjin Volcano Ia telah merangkumi banyak senario aplikasi seperti kereta, kewangan, pembacaan audio, alih suara video, dsb., dan telah membantu Ruhe Banyak syarikat terkemuka dalam industri, seperti Volkswagen, Zhuishu Artifact, telah merealisasikan aplikasi dan pengembangan keupayaan suara AI Pada masa hadapan, Huoshan Voice akan terus meneroka gabungan teknologi canggih dan senario perniagaan yang cekap, dan terus menyuntik tenaga inovatif ke dalam pengalaman pengguna dan pertumbuhan perniagaan, untuk mencapai nilai yang lebih tinggi.
Atas ialah kandungan terperinci Kekuatan teknikal Huoshan Voice TTS telah diperakui oleh Pusat Pemeriksaan dan Kuarantin Kebangsaan, dengan skor MOS setinggi 4.64. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Alat AI Hot

Undresser.AI Undress
Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover
Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool
Gambar buka pakaian secara percuma

Clothoff.io
Penyingkiran pakaian AI

Video Face Swap
Tukar muka dalam mana-mana video dengan mudah menggunakan alat tukar muka AI percuma kami!

Artikel Panas

Alat panas

Notepad++7.3.1
Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina
Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1
Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6
Alat pembangunan web visual

SublimeText3 versi Mac
Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Topik panas

Tan Dai, Presiden Volcano Engine, berkata syarikat yang ingin melaksanakan model besar dengan baik menghadapi tiga cabaran utama: kesan model, kos inferens dan kesukaran pelaksanaan: mereka mesti mempunyai sokongan model besar asas yang baik untuk menyelesaikan masalah yang kompleks, dan mereka juga mesti mempunyai inferens kos rendah. Perkhidmatan membolehkan model besar digunakan secara meluas, dan lebih banyak alat, platform dan aplikasi diperlukan untuk membantu syarikat melaksanakan senario. ——Tan Dai, Presiden Huoshan Engine 01. Model pundi kacang besar membuat kemunculan sulungnya dan banyak digunakan Menggilap kesan model adalah cabaran paling kritikal untuk pelaksanaan AI. Tan Dai menegaskan bahawa hanya melalui penggunaan meluas model yang baik boleh digilap. Pada masa ini, model Doubao memproses 120 bilion token teks dan menjana 30 juta imej setiap hari. Untuk membantu perusahaan melaksanakan senario model berskala besar, model berskala besar beanbao yang dibangunkan secara bebas oleh ByteDance akan dilancarkan melalui gunung berapi

Selepas lebih setahun pembangunan, AIGC telah beransur-ansur beralih daripada dialog teks dan penjanaan gambar kepada penjanaan video. Mengimbas kembali empat bulan lalu, kelahiran Sora menyebabkan rombakan dalam trek penjanaan video dan menggalakkan skop dan kedalaman aplikasi AIGC dalam bidang penciptaan video. Dalam era apabila semua orang bercakap tentang model besar, di satu pihak kita terkejut dengan kejutan visual yang dibawa oleh penjanaan video, sebaliknya kita berhadapan dengan kesukaran pelaksanaan. Memang benar bahawa model besar masih dalam tempoh berjalan dari penyelidikan dan pembangunan teknologi kepada amalan aplikasi, dan mereka masih perlu ditala berdasarkan senario perniagaan sebenar, tetapi jarak antara ideal dan realiti semakin disempitkan secara beransur-ansur. Pemasaran, sebagai senario pelaksanaan penting untuk teknologi kecerdasan buatan, telah menjadi hala tuju yang banyak syarikat dan pengamal ingin membuat penemuan. Sebaik sahaja anda menguasai kaedah yang sesuai, proses kreatif video pemasaran akan menjadi

Baru-baru ini, produk sintesis pertuturan Enjin Gunung Berapi telah memperoleh sijil pemeriksaan dan ujian yang dipertingkatkan sintesis pertuturan yang dikeluarkan oleh Pusat Pemeriksaan dan Pengujian Kualiti Produk Ucapan dan Pengiktirafan Imej (selepas ini dirujuk sebagai "Pusat Pemeriksaan Kebangsaan AI"). keperluan asas dan keperluan lanjutan sintesis pertuturan Piawaian peringkat tertinggi Pusat Pemeriksaan Nasional AI. Penilaian ini dijalankan daripada dimensi Cina Mandarin, berbilang dialek, berbilang bahasa, bahasa campuran, berbilang timbra dan pemperibadian Pasukan sokongan teknikal produk, Pasukan Suara Gunung Berapi, menyediakan perpustakaan bunyi yang kaya Skor MOS timbre adalah yang tertinggi Ia mencapai 4.64 mata, iaitu pada tahap terkemuka dalam industri. Sebagai agensi pemeriksaan dan ujian kualiti negara yang pertama dan satu-satunya untuk produk suara dan imej dalam bidang kecerdasan buatan dalam sistem pemeriksaan kualiti negara saya, Pusat Pemeriksaan Kebangsaan AI telah komited untuk mempromosikan kecerdasan buatan.

1. Sebelum membeli sesuatu produk, pengguna akan mencari dan melayari ulasan produk di media sosial. Oleh itu, menjadi semakin penting bagi syarikat untuk memasarkan produk mereka di platform sosial. Tujuan pemasaran adalah untuk: Menggalakkan penjualan produk Mewujudkan imej jenama Meningkatkan kesedaran jenama Menarik dan mengekalkan pelanggan Akhirnya meningkatkan keuntungan syarikat Model besar mempunyai pemahaman dan keupayaan penjanaan yang sangat baik dan boleh menyediakan pengguna dengan maklumat peribadi dengan menyemak imbas dan menganalisis cadangan kandungan data pengguna. Dalam isu keempat "AIGC Experience School", dua tetamu akan membincangkan secara mendalam peranan teknologi AIGC dalam meningkatkan "kadar penukaran pemasaran". Masa siaran langsung: 10 Julai, 19:00-19:45 Topik siaran langsung: Untuk mengekalkan pengguna, bagaimana AIGC meningkatkan kadar penukaran melalui pemperibadian? Episod keempat program itu mengundang dua orang penting

Untuk sekian lama, Volcano Engine telah menyediakan penyelesaian sari kata video pintar berdasarkan teknologi pengecaman pertuturan untuk platform video popular. Ringkasnya, ia adalah fungsi yang menggunakan teknologi AI untuk menukar secara automatik suara dan lirik dalam video kepada teks untuk membantu dalam penciptaan video. Walau bagaimanapun, dengan pertumbuhan pesat pengguna platform dan keperluan untuk jenis bahasa yang lebih kaya dan lebih pelbagai, teknologi pembelajaran diselia yang digunakan secara tradisional telah mencapai kesesakan, yang telah meletakkan pasukan dalam masalah sebenar. Seperti yang kita sedia maklum, pembelajaran diselia tradisional akan sangat bergantung pada data seliaan beranotasi secara manual, terutamanya dari segi pengoptimuman berterusan bahasa besar dan permulaan bahasa kecil yang sejuk. Mengambil bahasa utama seperti bahasa Cina, Mandarin dan Inggeris sebagai contoh, walaupun platform video menyediakan data suara yang mencukupi untuk senario perniagaan, selepas data yang diselia mencapai skala tertentu, ia akan terus

Semasa Hari Kebangsaan, kempen "Kata dialek membuktikan bahawa anda berasal dari kampung halaman" Douyin telah menarik penyertaan yang bersemangat daripada netizen dari seluruh negara. "Anugerah Dialek Tempatan" ini dengan cepat menjadi popular di Internet, yang tidak dapat dipisahkan daripada sumbangan fungsi terjemahan automatik dialek tempatan Douyin yang baru dilancarkan. Apabila pencipta merakam video pendek dalam dialek ibunda mereka, mereka menggunakan fungsi "sari kata automatik" dan memilih "Tukar kepada sari kata Mandarin", supaya pertuturan dialek dalam video boleh dikenali secara automatik dan kandungan dialek boleh ditukar menjadi sari kata Mandarin. Ini membolehkan netizen dari wilayah lain memahami pelbagai bahasa "Mandarin yang disulitkan". Netizen dari Fujian sendiri mengujinya dan mengatakan bahawa wilayah selatan Fujian dengan "sebutan yang berbeza" adalah wilayah di Wilayah Fujian, China.

Kesihatan + AI =? Penyelesaian pemakanan kesihatan otak untuk orang pertengahan umur dan warga tua, pemakanan pintar digital dan perkhidmatan kesihatan, penyelesaian komuniti kesihatan besar AIGC... Dengan berlangsungnya pertandingan inovasi ekologi "Kesihatan + AI", setiap satu daripadanya mengandungi tenaga teknologi dan memperkasakan industri kesihatan Penyelesaian inovatif akan keluar, dan jawapan kepada "Kesihatan + AI = perlahan-lahan muncul. Pada 26 Disember, pertandingan inovasi ekologi "Health + AI" yang ditaja bersama oleh Yili Group dan Volcano Engine mencapai keputusan yang berjaya Enam syarikat pemenang, termasuk Shanghai Bosten Network Technology Co., Ltd. dan Institut Penyelidikan Teknologi Pengkomputeran Pintar Zhongke Suzhou, terserlah. Dalam pertandingan yang berlangsung selama lebih sebulan, Yili berganding bahu dengan perusahaan saintifik dan teknologi yang cemerlang untuk meneroka integrasi mendalam teknologi AI dan industri kesihatan, terus meningkatkan jangkaan untuk pertandingan itu. Pertandingan Inovasi Ekologi "Kesihatan + AI".

Menurut berita dari laman web ini pada 22 Ogos, menurut berita rasmi dari Volcano Engine, Volcano Engine Video Cloud mengumumkan bahawa cip codec video yang dibangunkan sendiri telah berjaya menghasilkan filem dan dikeluarkan secara rasmi hari ini. Pegawai menyatakan bahawa kecekapan pemampatan video cip ini boleh dipertingkatkan lebih daripada 30% berbanding dengan "pengekod perkakasan arus perdana industri." Pada masa hadapan, ia akan menyediakan perkhidmatan video seperti Douyin dan Xigua Video, dan akan dibuka kepada pelanggan korporat melalui Awan Video Enjin Gunung Berapi. Dilaporkan bahawa Enjin Gunung Berapi adalah berdasarkan amalan berskala besar dan menggilap perkhidmatan video seperti Douyin, dan menyepadukan teknologi pengekodan dan penyahkodan video yang dibangunkan sendiri ke dalam cip khusus Kecekapan pemampatan meningkat lebih daripada 30% berbanding dengan pengekod perkakasan arus perdana industri, dan boleh digunakan pada video atas permintaan , siaran langsung, pemampatan imej, XR dan senario perniagaan yang lain. ▲Data pihak ketiga daripada Volcano Engine bagi sumber gambar menunjukkan bahawa bilangan pengguna Cina berada di antara 100 teratas
