Dies ist eine Einreichung für die AssemblyAI Challenge: Sophisticated Speech-to-Text.
Ich habe eine benutzerfreundliche Webseite mit einem responsiven Design erstellt, sodass sie auf verschiedenen Geräten wie Laptops, Mobiltelefonen und Tablets verwendet werden kann. Die App ist zu 100 % funktionsfähig und enthält einen Eingang zum Hochladen der Datei (Audio). Transkription durchführen möchten, eine Schaltfläche zum Starten der Transkription. Sobald Sie auf diese Schaltfläche klicken, wird die Transkription automatisch gestartet und der transkribierte Text wird direkt darunter angezeigt.
Die Webanwendung wird so bereitgestellt, dass jeder von jedem Gerät und von überall aus darauf zugreifen und sie verwenden kann. Kurz gesagt, ich habe eine gebrauchsfertige Webanwendung zum Transkribieren von Audios unter Verwendung des Universal-2-Modells zur Verarbeitung des Audios.
Der Code steht unter der kostenlosen MIT-Lizenz, Sie können das GitHub-Repository hier erreichen.
Die Web-App wird auch auf Render bereitgestellt, was bedeutet, dass sie über Benutzerfreundlichkeit und Barrierefreiheit verfügt. Sie können die Anwendung hier erreichen und verwenden.
Die App ist zu 100 % funktionsfähig, Sie können es auf dem Screenshot unten sehen.
Außerdem ist die Benutzeroberfläche für jeden, der Erfahrung im Umgang mit Technologien hat oder nicht, intuitiv. Sie können es auf diesem Bild sehen.
Das Anwendungsdesign ist responsiv, kann von jedem Gerät aus aufgerufen und verwendet werden, was bedeutet, dass es eine gute Benutzererfahrung und Zugänglichkeit bietet, Sie können es auf diesen Screenshots überprüfen:
Auf dem Technologie-Stack habe ich traditionelles HTML, CSS und JS verwendet, um ein Web-Frontend mit Benutzerfreundlichkeit und Benutzererfahrung zu erstellen. Im Backend habe ich Flask zum Definieren der Routen und zum Implementieren der von mir verwendeten Logik verwendet das Universal-2, AssamblyAI's Model zum Transkribieren des Audios, in einfachen Worten: Der Flask empfängt das Audio und sendet es an die Assembly AI API (The Wenn die Verbindung über den API-Schlüssel hergestellt wird), verarbeitet die API das Audio und sendet 200 Statusantworten.
Flask speichert das Audio im Upload-Ordner, sodass der Host beim Bereitstellen auf Render keinen Zugriff auf das Speichern und Zugreifen auf die Datei im Verzeichnis hat, was zu Fehlern führen kann und die Seite nicht übersetzt werden kann Dieses Problem ist erforderlich, um Cloud-Speicher zum Speichern des Audios zu verwenden und über die Cloud darauf zuzugreifen, und nicht für das Upload-Verzeichnis.
Das obige ist der detaillierte Inhalt vonAI Transcriber-App. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!