首页 > web前端 > js教程 > 人工智能发音训练器

人工智能发音训练器

Patricia Arquette
发布: 2024-12-30 00:46:10
原创
961 人浏览过

AI Pronunciation Trainer

在这篇文章中,我介绍了我目前正在进行的一个项目:AI Pronunciation Trainer(在线),这是一个旨在帮助您利用人工智能的力量提高发音的工具。这个项目是对 Thiagohgl 原始 AI 发音训练器的重构,我对其进行了一些改进,以使该工具更有效且更易于使用。

它是什么以及它的作用

AI发音训练器是一款利用人工智能评估您的发音并提供反馈的工具,帮助您提高发音并让别人更清楚地理解您的发音。使用 Silero STT / TTS 模型实现语音转文本和文本转语音功能,确保准确可靠的发音评估。

重构:前端和后端库的更新

我更新了后端库,将 PyTorch 特别更新到了 2.5.x 版本。我还更改了德语 Speech-to-Text 模型的版本,以修复 1.13.x 版本之后无法使用 PyTorch 的错误。
另外:关于前端:

  • 使用最新版本的 jQuery (3.7.1) 和 Bootstrap (5.3.3) 更新了 javascript 库
  • 基于 Gradio 5.x 的新前端
  • 添加了 Playwright 的 E2E 测试
  • 增加了书写、阅读和明显评估自由选择句的能力
  • 为新用户提供在 Gradio 块中使用 driver.js 和自定义 css/javascript 的指导
  • 回放录音中的各个单词,然后由文本转语音引擎读出同一单词的“理想”发音
  • 还添加了浏览器内文本转语音功能(在 Windows 11 上,仅当安装了英语和德语语言包时才有效)

在线版本:HuggingFace 空间的演示

您可以在我的 HuggingFace Space 上在线尝试我的项目。通过此在线演示,您无需安装或配置即可试验该工具的功能。 HuggingFace 空间提供了一种方便易用的方式来测试 AI 发音训练器,并了解它如何帮助您提高发音。请耐心等待,如果有一段时间没有人使用它,有时会有点慢或休眠(本地速度要快得多,尤其是如果您有一台功能强大的计算机)。还有一个嵌入版本的 HuggingFace。

空间

未来的作品

虽然效果很好,但显然还有改进的空间。以下是我计划实施的一些未来改进:

  • 接收原作作者对我的文档和更改的反馈
  • 向原作作者询问他所做的架构和功能选择的一些解释
  • 评估从 PyTorch 到 ONNX 运行时的过渡
  • 使用 Playwright 添加更多 E2E 测试

结论

我相信AI发音训练器对于任何想要独立提高发音的人来说都是一个有用的工具。借助人工智能的力量和重构过程中所做的改进,该工具可以提供准确可靠的反馈,帮助您更清晰、更自信地说话。我邀请您尝试 HuggingFace Space 演示,了解该项目如何帮助您实现更好的发音。

以上是人工智能发音训练器的详细内容。更多信息请关注PHP中文网其他相关文章!

来源:dev.to
本站声明
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn
作者最新文章
热门教程
更多>
最新下载
更多>
网站特效
网站源码
网站素材
前端模板