Untuk interaksi manusia-komputer, cara menjadikan mesin mempunyai pendengaran yang baik telah menjadi matlamat yang diteruskan tanpa henti dalam bidang AI sejak beberapa tahun kebelakangan ini. Sekitar tahun 2009, aplikasi model pembelajaran mendalam mula meninggalkan dunia akademik, dan teknologi pertuturan pintar yang diwakili oleh kebangkitan pertuturan, pengecaman, peningkatan dan sintesis juga beransur-ansur matang.
Contoh awal yang biasa ialah kelahiran siri pada tahun 2011. Suara pintar telah menjadi lompatan baharu dalam cara komunikasi dan interaksi antara manusia dan mesin. Selepas lebih sepuluh tahun pembangunan, soal jawab mesin manusia gaya "Hei, Siri" tidak lagi terhad kepada peranti terminal mudah alih, ia telah memasuki ribuan isi rumah dan digunakan secara meluas dalam pelbagai senario: pembesar suara pintar teman rumah, Tmall Jin untuk membeli-belah dalam talian yang mudah, terjemahan serentak pada mesyuarat, pembantu navigasi suara kereta semasa dalam perjalanan, dsb.
Memandangkan semakin banyak syarikat Internet dan pengeluar huluan secara aktif menggunakan trek suara pintar, produk seperti perkhidmatan pelanggan suara pintar, aplikasi AI perbualan dan pembantu maya AI telah mencapai pencapaian yang hebat. Dengan peningkatan kualiti selanjutnya, suara tindak balas adalah lebih semula jadi, pemahaman soalan lebih tepat, dan ia mempunyai "emosi kecil" sendiri.
Dalam era pendigitalan, trend kesalinghubungan segala-galanya tidak dapat dihalang. Suara pintar, sebagai antara muka utama untuk interaksi manusia-komputer semasa, berada dalam tempoh penyepaduan dan perlanggaran yang mendalam dengan ekonomi sebenar. Dengan perkembangan lanjut dan pengembangan senario aplikasi, kami juga telah melihat banyak masalah yang mencabar, seperti: cara mengenal pasti identiti penutur, cara mengenal pasti dialek, cara menghapuskan kekaburan, dan lain-lain adalah titik panas penyelidikan terkini.
Di sebalik kematangan teknologi, selalunya terdapat beberapa potensi, termasuk keupayaan inovasinya dalam aplikasi praktikal dan arah evolusi yang lebih berpotensi. Melihat ke peringkat seterusnya, teknologi suara pintar juga akan melihat arah aliran evolusi baharu Sebagai contoh: Bolehkah cip suara AI bersepadu yang mendalam menggantikan model berjalan model awan? Bolehkah penyelidikan inovatif mengenai gabungan pelbagai mod, pembelajaran tanpa pengawasan, dan penyepaduan silang disiplin otak mencapai hasil kejayaan? Kita akan lihat.
Jadi, apakah masalah pengeluaran sebenar yang dihadapi dalam penerokaan praktikal teknologi suara pintar dalam perusahaan utama? Bagaimana ia diselesaikan? Apakah kemajuan yang telah dicapai? Apakah perubahan baru yang telah berlaku dalam industri? Apakah trend pembangunan seterusnya? Sesi khas teknologi suara pintar "AIsummit Global Artificial Intelligence Technology Conference" akan membawa anda pemikiran yang mendalam!
Pada 7 Ogos, "Persidangan Teknologi Kecerdasan Buatan Global AIsummit" khusus untuk suara pintar yang dilancarkan oleh 51CTO akan datang!
1 Penerokaan Teknologi Pengecaman Pertuturan: Kongsi teknologi pengecaman pertuturan dalam senario aplikasi praktikal berskala besar seperti hujung ke hujung, cekap. penggunaan data, dsb. Dan penyelesaian teknikal perkataan panas berdasarkan automata awalan telah dicadangkan.
2. Amalan teknologi penilaian pertuturan: Dari segi teknologi pembetulan ralat sebutan pertuturan, digabungkan dengan senario penyelarasan tinggi bantuan kerja rumah, pemindahan pengetahuan pelbagai tugas dan ciri pelbagai mod penyelesaian gabungan dicadangkan, yang sangat besar Pada tahap tertentu, keupayaan diskriminasi faktor model dan keupayaan pengesanan ralat dalam persekitaran yang bising dipertingkatkan. Memandangkan kesukaran dalam melaksanakan penilaian suara, teknologi penilaian bersepadu berasaskan awan berprestasi tinggi telah dicadangkan.
3. Rangka kerja teknologi sintesis pertuturan: Kongsi pemikiran dan amalan Zuoyebang tentang penambahbaikan selanjutnya berdasarkan rangka kerja teknologi pertuturan volum data kecil sedia ada.
1. Proses aplikasi teknologi pengecaman pertuturan dalam senario pejabat: e-mel pejabat, pemesejan segera Input suara di pejabat. pembantu suara, sari kata masa nyata & transkripsi selepas mesyuarat.
2. Pemikiran penyelesaian: memenuhi kecerdasan dan meningkatkan kecekapan.
3 Cabaran dan peluang: Cabaran tugasan pengecaman pertuturan, cabaran yang dibawa oleh tugasan hiliran dan mesyuarat memberikan maklumat tambahan.
4. Pengenalan kepada kerja algoritma utama (sistem pengecaman pertuturan hujung ke hujung): Transduser & CIF, perkataan panas dinamik + statik, Sedar Konteks.
1.
2. Reka bentuk pemikiran dan pelaksanaan sistem sintesis pertuturan peringkat tinggi.
3.
4.
1. >2. Laluan pembinaan teknologi sintesis pertuturan berbilang modal
3. Aplikasi dalam senario perniagaan seperti keselamatan suara dan interaksi suara
Topik. 5 : Penerokaan dan amalan teknologi pengecaman pertuturan hujung ke hujung dalam 58.com
2. Kerja pengoptimuman model berdasarkan WeNet: latihan separa penyeliaan, Efficient Conformer, pemampatan model
3 -pelan penggunaan pengecaman pertuturan hingga akhir :Apakah tetamu penting yang akan menghadiri seni bina enjin yang dibangunkan sendiri, penggunaan perkhidmatan penyahkodan Wenet dan ujian prestasi penyahkodan penstriman/bukan penstriman
?
1. Song Yang, ketua pakar algoritma, ketua pejabat tengah pintar dan penerbit khas Zuoyebang2. Wang Qiangqiang, ketua pasukan teknologi pertuturan Zuoyebang
3 Zhang Jun, penyelidik algoritma pengecaman pertuturan di ByteDance AI Lab
4 Tan Xu, Penyelidik Utama di Microsoft Research Asia
5. Liu Zhongliang, ketua algoritma pertuturan di SOUL
6 Zhou Wei, ketua jabatan algoritma pertuturan dan arkitek algoritma 58.com AI Lab
Apakah aktiviti menarik lain yang ada?
Acara ini termasuk empat permainan interaktif yang menarik seperti "Jangan mengalah", "Bekerja dengan tuah", dan "Bijak dan berkongsi matlamat yang sama akan sentiasa ada hadiah menarik untuk mengejutkan anda". Kemudian, muktamad yang legenda dan misteri Apakah yang akan menjadi hadiah utama? Menunggu anda yang suka teknologi untuk datang dan mendedahkan rahsia di tapak! (PS: Saya mendengar bahawa lebih awal anda membuat temujanji untuk mendaftar, lebih tinggi peluang anda untuk memenangi hadiah!)
Klik untuk memasuki Persidangan Teknologi Kecerdasan Buatan Global AIsummit tapak web rasmi, ikut arahan untuk mengisi sepenuhnya dan menyerahkan maklumat untuk melengkapkan pendaftaran.
Imbas kod QR untuk menyertai kumpulan rasmi persidangan, sertai loteri dan menangi hadiah menarik seperti pembesar suara SONY, Bingdundun dan buku teknologi AI, serta sampul merah.
Atas ialah kandungan terperinci Siri semakin 'popular' Apakah kejayaan yang akan ada dalam suara pintar pada masa hadapan?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!