그것이 무엇이며 무엇을 하는가
AI 발음 트레이너는 인공지능을 활용하여 발음을 평가하고 피드백을 제공하여 발음을 향상하고 더 명확하게 이해할 수 있도록 돕는 도구입니다. 음성-텍스트 및 텍스트-음성 기능을 위해 Silero STT/TTS 모델을 사용하여 정확하고 신뢰할 수 있는 발음 평가를 보장합니다.
리팩터링: 프런트엔드 및 백엔드 라이브러리 업데이트
특히 PyTorch를 버전 2.5.x로 가져오는 백엔드 라이브러리를 업데이트했습니다. 또한 버전 1.13.x 이후 PyTorch 사용을 방해하는 버그를 수정하기 위해 독일어 Speech-to-Text 모델 버전을 변경했습니다.
또한: 프론트엔드에 관해서:
최신 버전의 jQuery(3.7.1) 및 Bootstrap(5.3.3)을 사용하여 업데이트된 자바스크립트 라이브러리
Gradio 5.x 기반의 새로운 프론트엔드
- Playwright와 함께 E2E 테스트를 추가했습니다.
- 자유 선택 문장을 쓰고, 읽고, 명확하게 평가하는 기능이 추가되었습니다
- Gradio 블록 내에서 Driver.js 및 사용자 정의 CSS/javascript를 사용하는 신규 사용자를 위한 가이드 투어
- 녹음 내 개별 단어 재생 후 TTS 엔진에서 읽은 동일한 단어의 '이상적인' 발음
- 브라우저 내 텍스트 음성 변환 기능도 추가되었습니다(Windows 11에서는 영어 및 독일어 언어 팩이 설치된 경우에만 작동함)
-
온라인 버전: HuggingFace 공간의 데모
-
HuggingFace Space에서 내 프로젝트를 온라인으로 체험해 볼 수 있습니다. 이 온라인 데모를 사용하면 설치나 구성 없이 도구의 기능을 실험해 볼 수 있습니다. HuggingFace 공간은 AI 발음 트레이너를 테스트하고 발음 향상에 어떻게 도움이 되는지 확인할 수 있는 편리하고 접근 가능한 방법을 제공합니다. 잠시 동안 아무도 사용하지 않은 경우 때로는 약간 느리거나 잠자기 상태가 될 수 있으므로 인내심을 가지십시오. (로컬에서는 훨씬 빠릅니다. 특히 강력한 컴퓨터를 사용하는 경우 더욱 그렇습니다.) HuggingFace의 내장 버전도 있습니다.
space
미래 작품
매우 잘 작동하지만 분명히 개선의 여지도 있습니다. 제가 구현할 향후 개선 사항은 다음과 같습니다.
- 원본 작성자로부터 내 문서 및 변경 사항에 대한 피드백을 받습니다.
- 원작 작가에게 그가 내린 건축적, 기능적 선택에 대한 설명을 물어보세요
- PyTorch에서 ONNX 런타임으로의 전환 평가
- Playwright를 통해 더 많은 E2E 테스트 추가
결론
AI 발음 트레이너는 스스로 발음을 향상시키고 싶은 모든 사람에게 유용한 도구라고 생각합니다. AI의 강력한 기능과 리팩터링 중 개선된 기능을 갖춘 이 도구는 정확하고 신뢰할 수 있는 피드백을 제공하여 더욱 명확하고 자신있게 말할 수 있도록 도와줍니다. HuggingFace Space 데모를 사용해보고 이 프로젝트가 발음 향상에 어떻게 도움이 될 수 있는지 이해해 보시기 바랍니다.
위 내용은 AI 발음 트레이너의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!