首頁 > web前端 > js教程 > 人工智慧發音訓練器

人工智慧發音訓練器

Patricia Arquette
發布: 2024-12-30 00:46:10
原創
965 人瀏覽過

AI Pronunciation Trainer

在這篇文章中,我介紹了我目前正在進行的一個項目:AI Pronunciation Trainer(在線),這是一個旨在幫助您利用人工智能的力量提高發音的工具。這個專案是對 Thiagohgl 原始 AI 發音訓練器的重構,我對其進行了一些改進,以使該工具更有效且更易於使用。

它是什麼以及它的作用

AI發音訓練器是一款利用人工智慧評估您的發音並提供回饋的工具,幫助您改善發音並讓別人更清楚地理解您的發音。使用 Silero STT / TTS 模型實現語音轉文字和文字轉語音功能,確保準確可靠的發音評估。

重構:前端和後端庫的更新

我更新了後端函式庫,將 PyTorch 特別更新到了 2.5.x 版本。我還更改了德語 Speech-to-Text 模型的版本,以修復 1.13.x 版本後無法使用 PyTorch 的錯誤。
另外:關於前端:

  • 使用最新版本的 jQuery (3.7.1) 和 Bootstrap (5.3.3) 更新了 javascript 函式庫
  • 基於 Gradio 5.x 的新前端
  • 新增了 Playwright 的 E2E 測試
  • 增加了書寫、閱讀和明顯評估自由選擇句的能力
  • 為新使用者提供在 Gradio 區塊中使用 driver.js 和自訂 css/javascript 的指導
  • 回放錄音中的各個單詞,然後由文字轉語音引擎讀出同一單字的「理想」發音
  • 也加入了瀏覽器內文字轉語音功能(在 Windows 11 上,僅當安裝了英語和德語語言套件時才有效)

線上版本:HuggingFace 空間的演示

您可以在我的 HuggingFace Space 上在線嘗試我的專案。透過此線上演示,您無需安裝或配置即可試驗工具的功能。 HuggingFace 空間提供了一種方便易用的方式來測試 AI 發音訓練器,並了解它如何幫助您改善發音。請耐心等待,如果有一段時間沒有人使用它,有時會有點慢或休眠(本地速度要快得多,尤其是如果您有一台功能強大的電腦)。還有一個嵌入版本的 HuggingFace。

空間

未來的作品

雖然效果很好,但顯然還有改進的空間。以下是我計劃實施的一些未來改進:

  • 接收原作作者對我的文件和更改的回饋
  • 向原作作者詢問他所做的架構和功能選擇的一些解釋
  • 評估從 PyTorch 到 ONNX 運行時的過渡
  • 使用 Playwright 增加更多 E2E 測試

結論

我相信AI發音訓練器對於任何想要獨立改善發音的人來說都是一個有用的工具。借助人工智慧的力量和重構過程中所做的改進,該工具可以提供準確可靠的回饋,幫助您更清晰、更自信地說話。我邀請您嘗試 HuggingFace Space 演示,了解該專案如何幫助您實現更好的發音。

以上是人工智慧發音訓練器的詳細內容。更多資訊請關注PHP中文網其他相關文章!

來源:dev.to
本網站聲明
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn
作者最新文章
熱門教學
更多>
最新下載
更多>
網站特效
網站源碼
網站素材
前端模板