Heim > Backend-Entwicklung > Python-Tutorial > AI Transcriber-App

AI Transcriber-App

Mary-Kate Olsen
Freigeben: 2024-11-17 10:43:03
Original
699 Leute haben es durchsucht

Dies ist eine Einreichung für die AssemblyAI Challenge: Sophisticated Speech-to-Text.

Was ich gebaut habe

Ich habe eine benutzerfreundliche Webseite mit einem responsiven Design erstellt, sodass sie auf verschiedenen Geräten wie Laptops, Mobiltelefonen und Tablets verwendet werden kann. Die App ist zu 100 % funktionsfähig und enthält einen Eingang zum Hochladen der Datei (Audio). Transkription durchführen möchten, eine Schaltfläche zum Starten der Transkription. Sobald Sie auf diese Schaltfläche klicken, wird die Transkription automatisch gestartet und der transkribierte Text wird direkt darunter angezeigt.

Die Webanwendung wird so bereitgestellt, dass jeder von jedem Gerät und von überall aus darauf zugreifen und sie verwenden kann. Kurz gesagt, ich habe eine gebrauchsfertige Webanwendung zum Transkribieren von Audios unter Verwendung des Universal-2-Modells zur Verarbeitung des Audios.

Demo

Der Code steht unter der kostenlosen MIT-Lizenz, Sie können das GitHub-Repository hier erreichen.
Die Web-App wird auch auf Render bereitgestellt, was bedeutet, dass sie über Benutzerfreundlichkeit und Barrierefreiheit verfügt. Sie können die Anwendung hier erreichen und verwenden.

Die App ist zu 100 % funktionsfähig, Sie können es auf dem Screenshot unten sehen.

AI Transcriptor App

Außerdem ist die Benutzeroberfläche für jeden, der Erfahrung im Umgang mit Technologien hat oder nicht, intuitiv. Sie können es auf diesem Bild sehen.

AI Transcriptor App

Das Anwendungsdesign ist responsiv, kann von jedem Gerät aus aufgerufen und verwendet werden, was bedeutet, dass es eine gute Benutzererfahrung und Zugänglichkeit bietet, Sie können es auf diesen Screenshots überprüfen:

AI Transcriptor App

AI Transcriptor App

Reise

Auf dem Technologie-Stack habe ich traditionelles HTML, CSS und JS verwendet, um ein Web-Frontend mit Benutzerfreundlichkeit und Benutzererfahrung zu erstellen. Im Backend habe ich Flask zum Definieren der Routen und zum Implementieren der von mir verwendeten Logik verwendet das Universal-2, AssamblyAI's Model zum Transkribieren des Audios, in einfachen Worten: Der Flask empfängt das Audio und sendet es an die Assembly AI API (The Wenn die Verbindung über den API-Schlüssel hergestellt wird), verarbeitet die API das Audio und sendet 200 Statusantworten.

Mögliche Probleme

Flask speichert das Audio im Upload-Ordner, sodass der Host beim Bereitstellen auf Render keinen Zugriff auf das Speichern und Zugreifen auf die Datei im Verzeichnis hat, was zu Fehlern führen kann und die Seite nicht übersetzt werden kann Dieses Problem ist erforderlich, um Cloud-Speicher zum Speichern des Audios zu verwenden und über die Cloud darauf zuzugreifen, und nicht für das Upload-Verzeichnis.

Das obige ist der detaillierte Inhalt vonAI Transcriber-App. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Quelle:dev.to
Erklärung dieser Website
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn
Neueste Artikel des Autors
Beliebte Tutorials
Mehr>
Neueste Downloads
Mehr>
Web-Effekte
Quellcode der Website
Website-Materialien
Frontend-Vorlage