人工智慧轉錄應用程式

Mary-Kate Olsen
發布: 2024-11-17 10:43:03
原創
629 人瀏覽過

這是 AssemblyAI 挑戰賽的提交內容:複雜的語音到文字。

我建造了什麼

我建立了一個易於使用的網頁,採用響應式設計,以便它可以在筆記型電腦、手機、平板電腦等不同設備上使用,該應用程式100% 正常運行,包含一個用於上傳您的文件(音訊)的輸入想要轉錄,有一個開始轉錄的按鈕,一旦你點擊這個按鈕,轉錄就會自動開始,轉錄的文字就會出現在下面。

部署了 Web 應用程序,以便每個人都可以從任何設備、任何地方訪問和使用它,總之,我有一個現成的 Web 應用程序,可以使用 Universal -2 模型來轉錄音頻來處理音頻。

示範

程式碼已獲得 MIT 免費許可,您可以在此處存取 GitHub 儲存庫。
Web 應用程式也部署在 Render 上,這意味著它具有可用性和可訪問性,您可以在此處存取並使用該應用程式。

該應用程式 100% 正常運行,您可以在下面的螢幕截圖中看到它。

AI Transcriptor App

對於任何有或沒有使用技術經驗的人來說,介面都很直觀,您可以在這張圖片上看到它。

AI Transcriptor App

應用程式設計響應靈敏,可以從任何裝置存取和使用,這意味著它具有良好的用戶體驗和可訪問性,您可以透過以下螢幕截圖查看:

AI Transcriptor App

AI Transcriptor App

旅行

在技術堆疊上,我使用傳統的HTML、CSS 和JS 來建立具有可用性和使用者體驗 的Web 前端,在後端,我使用Flask 來定義路由並實現邏輯,我使用Universal-2,AssamblyAI 的Model 來轉錄音頻,簡單來說,Flask 接收音頻,將其發送到Assembly AI API (透過 API Key 建立連線),API 處理音訊並傳送 200 狀態回應。

可能出現的問題

Flask 將音訊保存在uploads 資料夾中,因此當它部署在Render 上時,主機無權保存和存取該目錄中的文件,這可能會出錯並且頁面不會翻譯,請解決這個問題需要使用雲端儲存來保存音頻,並且Flask 從雲端存取它,而不是上傳目錄。

以上是人工智慧轉錄應用程式的詳細內容。更多資訊請關注PHP中文網其他相關文章!

來源:dev.to
本網站聲明
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn
作者最新文章
熱門教學
更多>
最新下載
更多>
網站特效
網站源碼
網站素材
前端模板