爆火的生成式AI,能讓智慧音箱起死回生嗎?
智慧音箱這類如今幾乎已經被大量消費者遺忘的產品,在先前經歷了2017年、2018年的「瘋狂」之後,早已不再是大多數消費者關注的對象。就在大家以為智慧音箱會曇花一現時,ChatGPT的橫空出世似乎讓智慧音箱有了煥發第二春的可能,也給了這個在走下坡路的行業一個新的機會。那麼,智慧音箱與現今爆紅的生成式AI能擦出火花嗎?
生成式AI之於智慧音箱產業,或許就是久旱逢甘霖。根據相關市場調查數據顯示,2023年第一季度,受產品同質化嚴重和消費者需求下降等因素的疊加影響,國內智慧音箱在線上的監測零售量為157萬台、再次下跌40.6%,而在整個2022年,智慧音箱國內全通路銷量為2,631萬台、年減了28%。
為什麼曾經被各大巨頭寄予厚望、甚至被視為可能是智能家庭入口的智能音箱,會在近年來滑入深淵呢?原因其實只有一個,就是智慧音箱真的不夠聰明。
在智慧音箱這概念火爆的2017年,業界曾有關於智慧音箱的重心到底應該在「智慧」還是「音質」上的討論。最終,騰訊聽聽、蘋果HomePod等一系列注重音質的產品,用它們的慘烈失敗證明智慧音箱的賣點只有可能是智慧化。
然而遺憾的是,絕大多數智慧音箱的智慧化程度只能用「捉襟見肘」來形容,而各大廠商對於ASR(語音辨識)、NLP自然語意處理、遠場拾音等人工智慧和聲學技術的進步,又實在有些過於樂觀。其實智慧音箱從技術層面來說很簡單,它的工作模式就是收集使用者的聲音,然後將音訊傳送到伺服器、再計算並產出結果,最終將結果傳送到智慧音箱上變成具體的行為,例如打開某個應用程式或是回覆用戶的提問。
沒錯,智慧音箱本身其實與人工智慧並不沾邊,小愛同學、小度、天貓精靈的真身藏在了相應的伺服器端上。這一切也導致了決定智慧音箱使用體驗的關鍵是遠場拾音技術,也就是在複雜的聲學環境下準確捕捉用戶語音指令的能力,畢竟總不能出現用戶說“講個笑話”,智能音箱聽成「放首歌」了吧。
智慧音箱的解決方案,則是使用大規模麥克風陣列來收集聲音,但其中卻有一個痛點一直得不到解決,那就是語音喚醒(keyword spotting)。大家在使用智慧音箱時,需要用到諸如「Hi,Siri」、「小愛同學」、「小度小度」這樣的喚醒詞,讓智慧音箱知道你在跟它說話,這也就意味著智能音箱缺乏主動服務的能力。更重要的是,由於技術的限制,智慧音箱長期以來只能理解簡單的指令,例如「音量調大一點/調小一點」、「播放某某人的某某歌」等,再複雜一些的語句辨識起來往往就很難。
而ChatGPT、文心一言這類生成式AI之於智慧音箱的意義,就是前者可以幫助智慧音箱理解更複雜的語句,並提供更自然的溝通。相信使用過微軟Bing Chat、百度文心一言或ChatGPT的朋友應該就知道,在與這類生成式AI對話時,並不需要用諸如“Hi,ChatGPT”這樣的開場白,直接輸入內容即可開始對話進程。
由於生成式AI是在基於大規模語言模型(LLM,Large Language Model)的基礎上,加入了人工標註數據和從人類反饋中進行強化學習技術,再輔以知識圖譜技術,即一種將知識寫成結構化三元組(包含實體、概念和關係)的多關係圖,讓AI得以理解人類指令的意義,並最終從龐大的資訊資料庫中選擇內容來回答。
ChatGPT這類產品比起Siri、小愛同學最大的變化,就是有了多輪對話的能力。相比Siri幾乎是“魚的記憶”,ChatGPT可以一直與用戶對話,再加上對於情緒更清晰的感知,讓用戶以為真的是在與活生生的人對話。對於一個消費級產品而言,使用者顯然並不在乎背後的技術原理有多高深,而是關注它能否解決問題或滿足需求。
生成式AI的魅力就在於它的能力上限很高,其中典型的例子就是微軟的Microsoft Copilot,同時它還能在某種程度上滿足用戶的社交需求,如今在海外已有創作者藉助ChatGPT ,推出了以自己為模型的“虛擬伴侶”,並收穫了超過1000名用戶。總的來說,將生成式AI與智慧音箱結合幾乎能補足後者的短板,使得其在消費級賽道擁有了可堪一用的智慧化水準。
事實上,部分智慧音箱廠商已經行動起來了。例如今年2月,百度在預熱文心一言時,小度就已宣布將融合文心一言,打造針對智慧型裝置場景的AI模型「小度靈機」;4月天貓精靈接入「鳥鳥分鳥」模型打造的“AI嘴替”,同時宣佈接入阿里巴巴的通義千問。
但要指出的是,生成式AI並非「萬靈藥」。就目前來說,一切生成式AI都面臨著一個不可避免的問題,那就是算力資源的稀缺。最近生成式AI天花板GPT-4「變笨」的消息引發了許多關注,相較於剛發佈時的狀態,如今GPT-4的文字程式碼品質全方位下降已然成為了用戶的共識。
沒錯,其實不只是GPT-4,像是ChatGPT、文心一言等面向大眾的這類產品都出現了類似的情況,使用者量的增加導致了大模型表現的下降。
現在生成式AI領域面臨的核心問題,就是算力資源緊張、無法應付洶湧而來的用戶,而為了確保用戶體驗,這類產品就只能降低大模型的效能、減少生成內容的時間來給伺服器「減負」。相較之下,智慧音箱的存量市場規模無疑更加龐大,所以在接取生成式AI後,幾乎不可避免地會遇到類似的問題。
未來很有可能會出現的情況,是智慧音箱的智慧化水平呈現出一條拋物線,初期用戶體驗會跨越式提升,但隨著用戶規模的不斷增加,智能化表現反而可能會“退化”回數年前的水平。
以上是爆火的生成式AI,能讓智慧音箱起死回生嗎?的詳細內容。更多資訊請關注PHP中文網其他相關文章!

熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

Video Face Swap
使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱門文章

熱工具

記事本++7.3.1
好用且免費的程式碼編輯器

SublimeText3漢化版
中文版,非常好用

禪工作室 13.0.1
強大的PHP整合開發環境

Dreamweaver CS6
視覺化網頁開發工具

SublimeText3 Mac版
神級程式碼編輯軟體(SublimeText3)

·美國總統科技顧問委員會成立的生成式AI工作小組旨在幫助評估人工智慧領域的關鍵機會和風險,並就盡可能確保公平、安全、負責地開發和部署這些技術向美國總統提供意見。 ·AMD的執行長蘇姿豐(LisaSu)和Google雲端首席資訊安全長菲爾·維納布爾斯(PhilVenables)也是這個工作小組的成員。華裔數學家、菲爾茨獎得主陶哲軒。當地時間5月13日,華裔數學家、菲爾茨獎得主陶哲軒公佈消息,他和物理學家勞拉·格林(LauraGreene)共同領導美國總統科技顧問委員會(PCAST)的生成式人工智慧工作小組。

圖片來源@視覺中國文|王吉偉從“人+RPA”到“人+生成式AI+RPA”,LLM如何影響RPA人機互動?換個角度,從人機互動看LLM如何影響RPA?影響程式開發與流程自動化人機互動的RPA,現在也要被LLM改變了? LLM如何影響人機互動?生成式AI怎麼改變RPA人機互動?一文看得懂:大模型時代來臨,基於LLM的生成式AI正在快速變革RPA人機交互;生成式AI重新定義人機交互,LLM正在影響RPA軟體架構變遷。如果問RPA對程式開發以及自動化有哪些貢獻,其中一個答案便是它改變了人機互動(HCI,h

▲本圖由AI生成酷家樂、立體家、東易日盛等已出手,裝潢裝潢產業鏈大舉引進AIGC生成式AI在裝潢裝潢領域有哪些應用?對設計師有啥影響?一文看懂告別各種設計軟體一句話生成效果圖,生成式AI正顛覆裝飾裝修領域使用人工智慧增強能力提升設計效率,生成式AI變革裝飾裝修行業生成式AI對裝飾裝修行業有哪些影響?未來發展趨勢如何?一文看懂LLM變革裝飾裝修,這28款流行生成式AI裝修設計工具值得上手體驗文/王吉偉在裝飾裝修領域,最近與AIGC關聯的消息著實不少。 Collov推出了生成式AI驅動的設計工具Col

生成式AI是人類一種人工智慧技術,可以產生各種類型的內容,包括文字、圖像、音訊和合成資料。那什麼是人工智慧?人工智慧和機器學習之間的差異是什麼?人工智慧是學科,是電腦科學的一個分支,研究智慧代理的創建,這些智慧代理是可以推理、學習和自主執行動作的系統。從本質上講,人工智慧與建築像人類一樣思考和行動的機器的理論和方法有關。在這個學科中,機器學習ML是人工智慧的一個領域。它是根據輸入資料訓練模型的程序或系統,經過訓練的模型可以從新的或未見過的資料中做出有用的預測,這些資料來自於訓練模型的統一數據

根據市場研究公司Omdia的最新報告,預計到2023年,生成式人工智慧(GenAI)將成為一個引人注目的技術趨勢,為企業和個人帶來重要的應用,包括教育。在電信領域,GenAI的用例主要集中在提供個人化行銷內容或支援更複雜的虛擬助手,以提升客戶體驗儘管生成式AI在網路營運中的應用並不明顯,但EnterpriseWeb進行了一項有趣的概念驗證,展示了該領域中生成式AI的潛力生成式AI在網絡自動化方面的能力和限制生成式AI在網絡運營中的早期應用之一是利用交互式指導替代工程手冊來幫助安裝網絡元件,從

亞馬遜雲端科技大中華區戰略業務發展部總經理顧凡2023年,大語言模型和生成式AI在全球市場“狂飆”,不僅引發了AI和雲端運算產業的“排山倒海”式跟進,也在強力吸引製造業巨頭們的入局。海爾創新設計中心就打造了全國首個AIGC工業設計解決方案,大幅縮短設計週期,並降低概念設計成本,不僅將整體概念設計提速了83%、集成渲染效率也提升了約90%,高效解決了設計階段人力成本高、概念產出與通過效率低等問題。西門子中國基於自有模型的智慧知識庫暨智慧會話機器人“小禹”,具備自然語言處理、知識庫檢索、透過資料訓練大語言

大模型落地加速,「產業實用」成為發展共識。 2024年5月17日,騰訊雲生成式AI產業應用高峰會在北京召開,公佈大模型研發、應用產品的系列進度。騰訊混元大模型能力持續升級,多個版本模型hunyuan-pro、hunyuan-standard、hunyuan-lite透過騰訊雲對外開放,滿足企業客戶、開發者在不同場景下的模型需求,落地最優性價比模型方案。騰訊雲大模型知識引擎、影像創作引擎、影片創作引擎三大工具發布,打造大模型時代原生工具鏈,透過PaaS服務簡化資料存取、模式精調、應用開發流程,協助企業

人工智慧的崛起正在推動軟體開發的快速發展。這項強大技術有可能徹底改變我們建構軟體的方法,對設計、開發、測試和部署等各個方面都會產生深遠影響。對於企圖進入動態軟體開發領域的企業來說,生成式人工智慧技術的問世為它們提供了前所未有的發展機會。將這項前沿技術納入其開發流程後,公司可以大幅提升生產效率、縮短產品上市週期,並推出在激烈競爭的數位市場中脫穎而出的優質軟體產品。根據麥肯錫的報告,預測2031年,生成式人工智慧市場規模可望達到4.4兆美元。這項預測不僅反映了一種趨勢,更顯示出技術和商業格局
