4 月 10 日消息,美國康乃爾大學的研究人員開發了一種新技術,可以透過聲納眼鏡進行無聲溝通。這種眼鏡利用微型揚聲器和麥克風來讀取佩戴者默念的單詞,從而可以在不需要物理輸入的情況下執行各種任務。
這項技術由康乃爾大學的博士生張瑞東(音譯)領導開發,是在一個類似的計畫的基礎上進行的改進,該計畫使用了一個無線耳機,而之前的模型則依賴攝影機。
據IT之家了解,該聲納眼鏡使用一種名為 EchoSpeech 的無聲語音識別接口,利用聲納來感知嘴部運動,同時使用一個深度學習算法實時分析回波特徵。這使得系統能夠以約 95% 的準確率識別佩戴者默念的單字。
這項技術最令人興奮的前景之一是,對於有語言障礙的人來說,可以使用它來無聲地將對話輸入到語音合成器中,然後將單字大聲說出來。眼鏡也可以用來在安靜的圖書館中控制音樂播放,或是在吵雜的音樂會上口述訊息。
該技術既小巧又低功耗,也不會侵犯隱私,因為沒有資料離開用戶的手機。這樣,就不會有隱私上的擔憂。眼鏡配戴非常方便,比其他可用的無聲語音辨識技術更實用、更可行。
研究人員表示,該系統只需要幾分鐘的訓練資料來學習使用者的語音模式,學習完成後,就可以朝使用者的臉上發送和接收聲波,感知嘴部運動,同時使用深度學習演算法分析回波特徵。該系統目前能夠識別 31 個孤立的命令和一串連續的數字,且錯誤率低於 10%。
該系統目前的版本提供了大約 10 小時的電池續航,並且可以透過藍牙無線地與用戶的智慧型手機通訊。智慧型手機負責處理和預測所有數據,並將結果傳輸到一些“動作鍵”,讓它可以播放音樂、與智慧型裝置互動或啟動語音助理。
康乃爾大學智慧型電腦介面未來互動(SciFi)實驗室正在利用康乃爾大學的一個資助計畫來探索將這項技術商業化的可能性。
以上是科學家研發人工智慧聲吶眼鏡:可辨識唇語,準確率達 95%的詳細內容。更多資訊請關注PHP中文網其他相關文章!