Bolehkah AI generatif panas menghidupkan semula pembesar suara pintar?
Produk seperti pembesar suara pintar, yang hampir dilupakan oleh sebilangan besar pengguna hari ini, telah lama tidak lagi menjadi tumpuan kebanyakan pengguna selepas mengalami "kegilaan" 2017 dan 2018. Hanya apabila semua orang berfikir bahawa pembesar suara pintar akan menjadi kilat dalam kuali, kemunculan ChatGPT nampaknya memberi penceramah pintar peluang kedua, dan juga memberikan industri yang semakin merosot ini peluang baharu. Jadi, bolehkah pembesar suara pintar dan AI generatif yang kini popular mencipta percikan api?
Bagi industri pembesar suara pintar, AI generatif mungkin seperti hujan selepas kemarau yang panjang. Menurut data tinjauan pasaran yang berkaitan, pada suku pertama 2023, disebabkan gabungan kesan faktor seperti kehomogenan produk yang teruk dan permintaan pengguna yang menurun, jualan runcit dalam talian yang dipantau bagi pembesar suara pintar domestik ialah 1.57 juta unit, satu lagi penurunan sebanyak 40.6% , manakala Sepanjang 2022, jualan omni-saluran domestik pembesar suara pintar ialah 26.31 juta unit, penurunan tahun ke tahun sebanyak 28%.
Mengapakah pembesar suara pintar, yang dahulunya sangat dinanti-nantikan oleh gergasi besar malah dianggap sebagai pintu masuk yang mungkin ke rumah pintar, tergelincir ke dalam jurang dalam beberapa tahun kebelakangan ini? Sebenarnya hanya ada satu sebab, dan itu ialah pembesar suara pintar sebenarnya tidak cukup pintar.
Pada tahun 2017, apabila konsep pembesar suara pintar sangat popular, terdapat perbincangan dalam industri sama ada tumpuan pembesar suara pintar harus "kecerdasan" atau "kualiti bunyi". Akhirnya, satu siri produk yang memfokuskan pada kualiti bunyi, seperti Tencent Listening dan Apple HomePod, menggunakan kegagalan tragis mereka untuk membuktikan bahawa titik jualan pembesar suara pintar hanya boleh menjadi kecerdasan.
Walau bagaimanapun, malangnya, tahap kecerdasan kebanyakan pembesar suara pintar hanya boleh digambarkan sebagai "diregangkan", manakala pengeluar utama mempunyai perhatian terhad kepada kecerdasan buatan dan kecerdasan buatan seperti ASR (pengecaman pertuturan), pemprosesan semantik semulajadi NLP dan jauh. -pickup bunyi medan Kemajuan teknologi akustik memang agak terlalu optimistik. Sebenarnya, pembesar suara pintar adalah sangat mudah dari perspektif teknikal mod kerjanya adalah untuk mengumpul suara pengguna, kemudian menghantar audio ke pelayan, kemudian mengira dan menghasilkan keputusan, dan akhirnya menghantar hasilnya kepada pembesar suara pintar untuk menghidupkan. ke dalam tingkah laku tertentu Contohnya, buka aplikasi atau balas soalan pengguna.
Ya, pembesar suara pintar itu sendiri tidak ada kaitan dengan kecerdasan buatan Identiti sebenar Xiaoai, Xiaodu dan Tmall Genie disembunyikan pada pelayan yang sepadan. Semua ini juga membawa kepada fakta bahawa kunci untuk menentukan pengalaman pembesar suara pintar ialah teknologi pikap bunyi medan jauh, iaitu keupayaan untuk menangkap arahan suara pengguna dengan tepat dalam persekitaran akustik yang kompleks Lagipun, pengguna tidak boleh mengatakan "beritahu jenaka" dan pembesar suara pintar mendengar Mari kita panggil ia "memainkan lagu".
Penyelesaian untuk pembesar suara pintar ialah menggunakan susunan mikrofon berskala besar untuk mengumpul bunyi, tetapi terdapat satu titik kesakitan yang belum diselesaikan, iaitu bangun suara (penglihatan kata kunci). Apabila anda menggunakan pembesar suara pintar, anda perlu menggunakan perkataan bangun tidur seperti "Hai, Siri", "Rakan Sekelas Xiao Ai" dan "Xiaodu Xiaodu" untuk memberitahu pembesar suara pintar itu bahawa anda sedang bercakap dengannya, yang bermaksud pintar itu pembesar suara Pembesar suara tidak mempunyai keupayaan untuk berkhidmat secara aktif. Lebih penting lagi, disebabkan oleh keterbatasan teknikal, pembesar suara pintar telah lama dapat memahami hanya arahan mudah, seperti "besarkan/turunkan kelantangan", "mainkan lagu fulan dengan fulan", dan lebih kompleks. arahan. Pengecaman ayat selalunya sukar.
Kepentingan AI generatif seperti ChatGPT dan Wen Xinyiyan kepada pembesar suara pintar ialah yang pertama boleh membantu pembesar suara pintar memahami ayat yang lebih kompleks dan menyediakan komunikasi yang lebih semula jadi. Saya percaya rakan-rakan yang telah menggunakan Microsoft Bing Chat, Baidu Wenxinyiyan atau ChatGPT harus tahu bahawa apabila bercakap dengan jenis AI generatif ini, tidak perlu menggunakan pernyataan pembukaan seperti "Hai, ChatGPT", anda boleh mula dengan menaip terus kandungan proses perbualan.
Oleh kerana AI generatif adalah berdasarkan model bahasa berskala besar (LLM, Model Bahasa Besar), ia menambahkan data anotasi manual dan teknologi pembelajaran pengukuhan daripada maklum balas manusia, dan ditambah dengan teknologi graf pengetahuan, yang merupakan pengetahuan Penulisan kepada pelbagai -gambar rajah perhubungan tripel berstruktur (termasuk entiti, konsep dan perhubungan) membolehkan AI memahami maksud arahan manusia dan akhirnya memilih kandungan daripada pangkalan data maklumat yang besar untuk dijawab.
Perubahan terbesar dalam produk seperti ChatGPT berbanding Siri dan Xiaoai ialah keupayaan untuk mengadakan berbilang pusingan perbualan. Berbanding dengan Siri, yang hampir seperti "memori ikan", ChatGPT sentiasa boleh bercakap dengan pengguna Ditambah dengan persepsi emosi yang lebih jelas, pengguna merasakan bahawa mereka benar-benar bercakap dengan orang yang hidup. Untuk produk pengguna, pengguna jelas tidak mengambil berat betapa majunya prinsip teknikal di sebaliknya, tetapi fokus pada sama ada ia boleh menyelesaikan masalah atau memenuhi keperluan.
Pesona AI generatif terletak pada had atas keupayaannya yang tinggi. Contoh biasa ialah Microsoft Copilot Pada masa yang sama, ia juga boleh memenuhi keperluan sosial pengguna pada tahap tertentu Kini terdapat pencipta di luar negara , melancarkan "sahabat maya" yang dimodelkan mengikut dirinya dan memperoleh lebih daripada 1,000 pengguna. Secara umum, menggabungkan AI generatif dengan pembesar suara pintar hampir boleh menampung kekurangan yang terakhir, memberikannya tahap kecerdasan yang boleh digunakan dalam pasaran pengguna.
Malah, beberapa pengeluar pembesar suara pintar telah pun mengambil tindakan. Sebagai contoh, pada Februari tahun ini, semasa Baidu memanaskan badan Wen Xin Yi Yan, Xiaodu telah mengumumkan bahawa ia akan menyepadukan Wen Xin Yi Yan untuk mencipta model AI "Xiaodu Lingji" untuk senario peranti pintar pada bulan April, Tmall Genie mengakses "Niaodu" "Penggantian mulut AI" yang dicipta oleh model "burung membahagikan burung" juga mengumumkan aksesnya kepada Tongyi Qianwen Alibaba.
Walau bagaimanapun, perlu ditegaskan bahawa AI generatif bukanlah "penawar". Buat masa ini, semua AI generatif menghadapi masalah yang tidak dapat dielakkan, iaitu kekurangan sumber pengkomputeran. Berita baru-baru ini bahawa siling AI generatif GPT-4 telah menjadi bodoh telah menarik banyak perhatian Berbanding dengan negeri ketika ia pertama kali dikeluarkan, ia telah menjadi konsensus di kalangan pengguna bahawa kualiti kod teks GPT-4 telah merosot. semua aspek.
Ya, sebenarnya, bukan sahaja GPT-4, tetapi juga produk yang dihadapi oleh orang ramai seperti ChatGPT dan Wenxinyiyan telah mengalami situasi yang sama Peningkatan bilangan pengguna telah menyebabkan penurunan dalam prestasi model besar.
Masalah teras yang dihadapi dalam bidang AI generatif sekarang ialah sumber pengkomputeran yang ketat dan tidak dapat menampung kemasukan pengguna Bagi memastikan pengalaman pengguna, produk tersebut hanya dapat mengurangkan prestasi model besar dan mengurangkan masa untuk menjana kandungan Untuk "mengurangkan beban" pada pelayan. Sebagai perbandingan, saiz pasaran sedia ada pembesar suara pintar sudah pasti lebih besar, jadi selepas mengakses AI generatif, hampir tidak dapat dielakkan untuk menghadapi masalah yang sama.
Apa yang mungkin berlaku pada masa hadapan ialah tahap kecerdasan pembesar suara pintar akan menunjukkan parabola Pengalaman pengguna awal akan meningkat dengan pesat, tetapi apabila bilangan pengguna terus meningkat, prestasi pintar mungkin ". merendahkan" Kembali ke tahap beberapa tahun lalu.
Atas ialah kandungan terperinci Bolehkah AI generatif panas menghidupkan semula pembesar suara pintar?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Alat AI Hot

Undresser.AI Undress
Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover
Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool
Gambar buka pakaian secara percuma

Clothoff.io
Penyingkiran pakaian AI

AI Hentai Generator
Menjana ai hentai secara percuma.

Artikel Panas

Alat panas

Notepad++7.3.1
Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina
Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1
Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6
Alat pembangunan web visual

SublimeText3 versi Mac
Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Topik panas



Kumpulan Kerja Generatif AI yang ditubuhkan oleh Majlis Penasihat Presiden mengenai Sains dan Teknologi direka untuk membantu menilai peluang dan risiko utama dalam bidang kecerdasan buatan dan memberi nasihat kepada Presiden untuk memastikan teknologi ini dibangunkan dan digunakan secara adil, selamat. , dan bertanggungjawab yang mungkin. Ketua Pegawai Eksekutif AMD Lisa Su dan Ketua Pegawai Keselamatan Maklumat Google Cloud Phil Venables juga merupakan ahli kumpulan kerja. Ahli matematik Cina-Amerika dan pemenang Pingat Fields Terence Tao. Pada 13 Mei, waktu tempatan, ahli matematik China-Amerika dan pemenang Pingat Fields Terence Tao mengumumkan bahawa dia dan ahli fizik Laura Greene akan mengetuai bersama Kumpulan Kerja Kecerdasan Buatan Generatif bagi Majlis Penasihat Presiden AS mengenai Sains dan Teknologi (PCAST) .

Sumber imej@visualchinesewen|Wang Jiwei Daripada "manusia + RPA" kepada "manusia + generatif AI + RPA", bagaimanakah LLM mempengaruhi interaksi manusia-komputer RPA? Dari perspektif lain, bagaimanakah LLM mempengaruhi RPA dari perspektif interaksi manusia-komputer? RPA, yang menjejaskan interaksi manusia-komputer dalam pembangunan program dan automasi proses, kini akan turut diubah oleh LLM? Bagaimanakah LLM mempengaruhi interaksi manusia-komputer? Bagaimanakah AI generatif mengubah interaksi manusia-komputer RPA? Ketahui lebih lanjut mengenainya dalam satu artikel: Era model besar akan datang, dan AI generatif berdasarkan LLM sedang mengubah interaksi manusia-komputer RPA dengan pantas mentakrifkan semula interaksi manusia-komputer, dan LLM mempengaruhi perubahan dalam seni bina perisian RPA. Jika anda bertanya apakah sumbangan RPA kepada pembangunan program dan automasi, salah satu jawapannya ialah ia telah mengubah interaksi manusia-komputer (HCI, h

AI Generatif ialah sejenis teknologi kecerdasan buatan manusia yang boleh menjana pelbagai jenis kandungan, termasuk teks, imej, audio dan data sintetik. Jadi apakah kecerdasan buatan? Apakah perbezaan antara kecerdasan buatan dan pembelajaran mesin? Kecerdasan buatan ialah disiplin, cabang sains komputer, yang mengkaji penciptaan agen pintar, yang merupakan sistem yang boleh menaakul, belajar, dan melakukan tindakan secara autonomi. Pada terasnya, kecerdasan buatan adalah berkenaan dengan teori dan kaedah membina mesin yang berfikir dan bertindak seperti manusia. Dalam disiplin ini, pembelajaran mesin ML ialah bidang kecerdasan buatan. Ia adalah program atau sistem yang melatih model berdasarkan data input Model terlatih boleh membuat ramalan berguna daripada data baharu atau tidak dilihat yang diperoleh daripada data bersatu yang model itu dilatih.

▲Gambar ini dijana oleh AI Kujiale, Sanweijia, Dongyi Risheng, dsb. telah mengambil tindakan Rangkaian industri hiasan dan hiasan telah memperkenalkan AIGC secara besar-besaran ? Apakah kesannya kepada pereka bentuk? Satu artikel untuk memahami dan mengucapkan selamat tinggal kepada pelbagai perisian reka bentuk untuk menjana rendering dalam satu ayat Generative AI meruntuhkan bidang hiasan dan hiasan Menggunakan kecerdasan buatan untuk meningkatkan keupayaan AI Generatif sedang merevolusikan industri hiasan dan hiasan kesan AI generatif terhadap industri hiasan dan hiasan? Apakah trend pembangunan masa depan? Satu artikel untuk memahami cara LLM merevolusikan hiasan dan hiasan 28 alat reka bentuk hiasan AI generatif yang popular ini patut dicuba. Collov melancarkan alat reka bentuk dikuasakan AI generatif Col

Kepintaran buatan generatif (GenAI) dijangka menjadi trend teknologi yang menarik menjelang 2023, membawa aplikasi penting kepada perniagaan dan individu, termasuk pendidikan, menurut laporan baharu daripada firma penyelidikan pasaran Omdia. Dalam sektor telekomunikasi, kes penggunaan GenAI tertumpu terutamanya pada menyampaikan kandungan pemasaran yang diperibadikan atau menyokong pembantu maya yang lebih canggih untuk meningkatkan pengalaman pelanggan Walaupun aplikasi AI generatif dalam operasi rangkaian tidak jelas, EnterpriseWeb telah membangunkan konsep yang menarik potensi AI generatif dalam bidang, keupayaan dan batasan AI generatif dalam automasi rangkaian Salah satu aplikasi awal AI generatif dalam operasi rangkaian ialah penggunaan panduan interaktif sebagai pengganti manual kejuruteraan untuk membantu memasang elemen rangkaian, daripada

Gu Fan, Pengurus Besar Jabatan Pembangunan Perniagaan Strategik Teknologi Awan Amazon Greater China Pada tahun 2023, model bahasa besar dan AI generatif akan "melonjak" dalam pasaran global, bukan sahaja mencetuskan "tindakan yang luar biasa" dalam AI dan industri pengkomputeran awan, tetapi juga menarik minat syarikat gergasi pembuatan untuk menyertai industri. Pusat Reka Bentuk Inovasi Haier mencipta penyelesaian reka bentuk industri AIGC yang pertama di negara ini, yang memendekkan kitaran reka bentuk dengan ketara dan mengurangkan kos reka bentuk konseptual Ia bukan sahaja mempercepatkan reka bentuk konsep keseluruhan sebanyak 83%, tetapi juga meningkatkan kecekapan rendering bersepadu sebanyak kira-kira 90%, dengan berkesan. menyelesaikan Masalah termasuk kos buruh yang tinggi dan output konsep rendah dan kecekapan kelulusan dalam peringkat reka bentuk. Pangkalan pengetahuan pintar Siemens China dan robot perbualan pintar "Xiaoyu" berdasarkan modelnya sendiri mempunyai pemprosesan bahasa semula jadi, perolehan pangkalan pengetahuan dan latihan bahasa besar melalui data

Pelaksanaan model besar semakin pantas, dan "praktikal industri" telah menjadi konsensus pembangunan. Pada 17 Mei 2024, Sidang Kemuncak Aplikasi Industri AI Generatif Awan Tencent telah diadakan di Beijing, mengumumkan satu siri kemajuan dalam pembangunan model besar dan produk aplikasi. Keupayaan model besar Hunyuan Tencent terus dinaik taraf Berbilang versi model hunyuan-pro, hunyuan-standard, dan hunyuan-lite terbuka kepada orang ramai melalui Tencent Cloud untuk memenuhi keperluan model pelanggan dan pembangun perusahaan dalam senario yang berbeza, dan untuk melaksanakan. penyelesaian model kos efektif yang optimum. Tencent Cloud mengeluarkan tiga alat utama: enjin pengetahuan untuk model besar, enjin penciptaan imej dan enjin penciptaan video, mencipta rantaian alat asli untuk era model besar, memudahkan akses data, penalaan halus model dan proses pembangunan aplikasi melalui perkhidmatan PaaS untuk membantu perusahaan

Peningkatan kecerdasan buatan memacu perkembangan pesat pembangunan perisian. Teknologi berkuasa ini berpotensi untuk merevolusikan cara kami membina perisian, dengan kesan yang meluas pada setiap aspek reka bentuk, pembangunan, ujian dan penggunaan. Bagi syarikat yang cuba memasuki bidang pembangunan perisian dinamik, kemunculan teknologi kecerdasan buatan generatif memberikan mereka peluang pembangunan yang belum pernah terjadi sebelumnya. Dengan menggabungkan teknologi canggih ini ke dalam proses pembangunan mereka, syarikat boleh meningkatkan kecekapan pengeluaran dengan ketara, memendekkan masa produk untuk memasarkan dan melancarkan produk perisian berkualiti tinggi yang menonjol dalam pasaran digital yang sangat kompetitif. Menurut laporan McKinsey, saiz pasaran kecerdasan buatan generatif dijangka mencecah AS$4.4 trilion menjelang 2031. Ramalan ini bukan sahaja menggambarkan arah aliran, tetapi juga menunjukkan teknologi dan landskap perniagaan.
