AssemblyAI Challenge: Sophisticated Speech-to-Text에 대한 출품작입니다.
노트북, 휴대폰, 태블릿과 같은 다양한 장치에서 사용할 수 있도록 반응형 디자인으로 사용하기 쉬운 웹 페이지를 만들었습니다. 앱은 100% 작동하며 파일(오디오)을 업로드하는 입력이 포함되어 있습니다. 스크립트를 작성하고 싶으면 스크립트 작성을 시작하는 버튼이 있습니다. 이 버튼을 클릭하면 스크립트 작성이 자동으로 시작되고 스크립트된 텍스트가 바로 아래에 표시됩니다.
웹 애플리케이션은 모든 사람이 어느 장치에서나 어디서나 액세스하고 사용할 수 있도록 배포됩니다. 요약하자면 오디오 처리를 위해 Universal -2 모델을 사용하여 오디오를 텍스트로 변환하는 데 사용할 수 있는 웹 앱이 있습니다.
코드는 MIT 무료 라이센스를 따르며 여기에서 GitHub 저장소에 접속할 수 있습니다.
웹 앱은 Render에도 배포됩니다. 즉, 유용성 및 접근성이 있으며 여기에서 애플리케이션에 접근하여 사용할 수 있습니다.
앱은 100% 작동하며 아래 스크린샷에서 확인할 수 있습니다.
또한 인터페이스는 기술 사용 경험이 있든 없든 누구나 직관적이므로 이 이미지에서 확인할 수 있습니다.
애플리케이션 디자인은 반응형이며 모든 기기에서 액세스하고 사용할 수 있습니다. 이는 좋은 사용자 경험과 접근성을 갖추고 있음을 의미합니다. 다음 스크린샷에서 확인할 수 있습니다.
기술 스택에서는 사용성 및 사용자 경험을 갖춘 웹 프런트엔드를 구축하기 위해 전통적인 HTML, CSS 및 JS를 사용했고, 백엔드에서는 경로를 정의하고 로직을 구현하기 위해 Flask를 사용했습니다. Universal-2, AssamblyAI의 모델을 사용하여 오디오를 기록하면 간단히 말하면 Flask가 오디오를 수신하여 Assembly AI API로 보내고(연결은 API 키를 통해 설정됨) API가 처리합니다. 오디오를 전송하고 200 상태 응답을 보냅니다.
Flask는 업로드 폴더에 오디오를 저장하므로 Render에 배포될 때 호스트는 디렉터리에 파일을 저장하고 액세스할 수 없습니다. 이로 인해 오류가 발생할 수 있고 페이지가 번역되지 않습니다. 이 문제는 오디오를 저장하기 위해 클라우드 스토리지를 사용해야 하고 업로드 디렉터리가 아닌 클라우드에서 플라스크에 액세스해야 합니다.
위 내용은 AI 전사기 앱의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!