Bagaimana untuk menukar kandungan audio kepada format teks dalam Python-Tutorial Python-php.cn

Rumah

pembangunan bahagian belakang

Tutorial Python

Bagaimana untuk menukar kandungan audio kepada format teks dalam Python

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

May 10, 2023 am 11:07 AM

python

Bina persekitaran pembangunan

Pergi ke direktori tempat persekitaran maya Python disimpan. Saya menyimpan direktori saya dalam subdirektori venvs di bawah direktori rumah pengguna. Gunakan arahan berikut untuk mencipta virtualenv baharu untuk projek ini.

python3 -m venv ~/venvs/pytranscribe

Salin selepas log masuk

Aktifkan virtualenv dengan arahan shell:

source ~/venvs/pytranscribe/bin/activate

Salin selepas log masuk

Selepas melaksanakan arahan di atas, command prompt akan berubah, jadi nama virtualenv akan bermula dengan format command prompt asal, jika anda prompt Just $, maka ia akan kelihatan seperti ini:

(pytranscribe) $

Salin selepas log masuk

Ingat bahawa anda mesti mengaktifkan virtualenv anda dalam tetingkap terminal baharu menggunakan kebergantungan dalam setiap virtualenv.

Kini kita boleh memasang pakej permintaan ke dalam virtualenv yang diaktifkan tetapi kosong.

pip install requests==2.24.0

Salin selepas log masuk

Cari output yang serupa dengan yang berikut untuk mengesahkan bahawa pakej yang sepadan telah dipasang dengan betul daripada PyPI.

(pytranscribe) $ pip install requests==2.24.0  Collecting requests==2.24.0    Using cached https://files.pythonhosted.org/packages/45/1e/0c169c6a5381e241ba7404532c16a21d86ab872c9bed8bdcd4c423954103/requests-2.24.0-py2.py3-none-any.whl  Collecting certifi>=2017.4.17 (from requests==2.24.0)    Using cached https://files.pythonhosted.org/packages/5e/c4/6c4fe722df5343c33226f0b4e0bb042e4dc13483228b4718baf286f86d87/certifi-2020.6.20-py2.py3-none-any.whl  Collecting urllib3!=1.25.0,!=1.25.1,<1.26,>=1.21.1 (from requests==2.24.0)    Using cached https://files.pythonhosted.org/packages/9f/f0/a391d1463ebb1b233795cabfc0ef38d3db4442339de68f847026199e69d7/urllib3-1.25.10-py2.py3-none-any.whl  Collecting chardet<4,>=3.0.2 (from requests==2.24.0)    Using cached https://files.pythonhosted.org/packages/bc/a9/01ffebfb562e4274b6487b4bb1ddec7ca55ec7510b22e4c51f14098443b8/chardet-3.0.4-py2.py3-none-any.whl  Collecting idna<3,>=2.5 (from requests==2.24.0)    Using cached https://files.pythonhosted.org/packages/a2/38/928ddce2273eaa564f6f50de919327bf3a00f091b5baba8dfa9460f3a8a8/idna-2.10-py2.py3-none-any.whl  Installing collected packages: certifi, urllib3, chardet, idna, requests  Successfully installed certifi-2020.6.20 chardet-3.0.4 idna-2.10 requests-2.24.0 urllib3-1.25.10

Salin selepas log masuk

Kami telah memasang semua kebergantungan yang diperlukan supaya kami boleh memulakan pengekodan aplikasi.

Muat naik, lancarkan dan transkripsi audio

Kami mempunyai semua yang kami perlukan untuk mula membina apl yang menukar audio kepada teks. Kami akan membina aplikasi ini dalam tiga fail:

1. upload_audio_file.py: Muat naik fail audio anda ke lokasi selamat pada perkhidmatan AssemblyAI supaya ia boleh diproses. Jika fail audio anda sudah boleh diakses melalui URL awam, anda tidak perlu melakukan langkah ini, cuma ikuti permulaan pantas ini

2. initial_transcription.py: Beritahu API fail yang ingin anda transkripsi dan mulakannya segera

3 get_transcription.py: Memaparkan status transkripsi jika transkripsi masih diproses, atau memaparkan hasil transkripsi selepas pemprosesan selesai

Cipta direktori baharu yang dipanggil pytranscribe untuk menyimpan fail sebagai kami menulisnya. Kemudian pergi ke direktori projek baharu.

mkdir pytranscibe  cd pytranscribe

Salin selepas log masuk

Kami juga perlu mengeksport kunci API AssemblyAI sebagai pembolehubah persekitaran. Daftar untuk akaun AssemblyAI dan log masuk ke papan pemuka AssemblyAI, kemudian salin "token API anda"

export ASSEMBLYAI_KEY=your-api-key-here

Salin selepas log masuk

Sila ambil perhatian bahawa arahan eksport mesti digunakan dalam setiap tetingkap baris arahan untuk memastikan kunci ini boleh diakses. Jika anda tidak mengeksport teg sebagai ASSEMBLYAI_KEY dalam persekitaran tempat anda menjalankan skrip, skrip yang kami tulis tidak akan dapat mengakses API.

Memandangkan kami telah mencipta direktori projek dan menetapkan kunci API sebagai pembolehubah persekitaran, mari teruskan menulis kod untuk fail pertama kami yang akan memuat naik fail audio ke perkhidmatan AssemblyAI.

Muat naik fail audio dan transkripsi

Buat fail baharu bernama upload_audio_file.py dan letakkan kod berikut di dalamnya:

import argparse  import os  import requests  API_URL = "https://api.assemblyai.com/v2/"  def upload_file_to_api(filename):      """Checks for a valid file and then uploads it to AssemblyAI      so it can be saved to a secure URL that only that service can access.      When the upload is complete we can then initiate the transcription      API call.      Returns the API JSON if successful, or None if file does not exist.      """      if not os.path.exists(filename):          return None      def read_file(filename, chunk_size=5242880):          with open(filename, 'rb') as _file:              while True:                  data = _file.read(chunk_size)                  if not data:                      break                  yield data      headers = {'authorization': os.getenv("ASSEMBLYAI_KEY")}      response = requests.post("".join([API_URL, "upload"]), headersheaders=headers,                               data=read_file(filename))      return response.json()

Salin selepas log masuk

Kod di atas diimport pakej argparse, os dan permintaan supaya kita boleh menggunakannya dalam skrip ini. API_URL ialah pemalar yang mempunyai URL asas perkhidmatan AssemblyAI. Kami mentakrifkan fungsi upload_file_to_api dengan satu parameter, nama fail hendaklah rentetan yang mengandungi laluan mutlak ke fail dan nama failnya.

Dalam fungsi, kami menyemak sama ada fail itu wujud dan kemudian menstrimkan fail besar ke API AssemblyAI menggunakan pengekodan pemindahan chunked Request.

Fungsi getenv modul os membaca set API pada baris arahan menggunakan perintah eksport dengan getenv. Pastikan anda menggunakan perintah eksport dalam terminal yang menjalankan skrip ini, jika tidak nilai ASSEMBLYAI_KEY akan kosong. Jika ragu-ragu, gunakan echo $ASSEMBLY_AI untuk melihat sama ada nilainya sepadan dengan kunci API anda.

Untuk menggunakan fungsi upload_file_to_api, tambah baris kod berikut pada fail upload_audio_file.py supaya kami boleh melaksanakan kod ini dengan betul sebagai skrip yang dipanggil menggunakan arahan python:

if __name__ == "__main__":      parser = argparse.ArgumentParser()      parser.add_argument("filename")      args = parser.parse_args()      upload_filename = args.filename      response_json = upload_file_to_api(upload_filename)      if not response_json:          print("file does not exist")      else:          print("File uploaded to URL: {}".format(response_json['upload_url']))

Salin selepas log masuk

di atas The kod mencipta objek ArgumentParser, yang membolehkan aplikasi mengambil satu hujah daripada baris arahan untuk menentukan objek yang ingin kami akses, baca dan muat naik fail ke perkhidmatan AssmeblyAI.

Jika fail tidak wujud, skrip akan memaparkan mesej yang menyatakan bahawa fail tidak dapat ditemui. Dalam laluan kami telah menemui fail yang betul dan kemudian memuat naik fail menggunakan kod dalam fungsi upload_file_to_api.

Laksanakan skrip dengan menjalankan skrip upload_audio_file.py yang lengkap pada baris arahan menggunakan arahan python. Gantikan FULL_PATH_TO_FILE dengan laluan mutlak ke fail yang ingin anda muat naik, contohnya /Users/matt/devel/audio.mp3.

python upload_audio_file.py FULL_PATH_TO_FILE

Salin selepas log masuk

Dengan mengandaikan fail ditemui di lokasi yang anda tentukan, apabila skrip selesai memuat naik fail, ia akan mencetak mesej dengan URL unik:

File uploaded to URL: https://cdn.assemblyai.com/upload/463ce27f-0922-4ea9-9ce4-3353d84b5638

Salin selepas log masuk

URL ini tidak awam dan boleh hanya Digunakan oleh perkhidmatan AssemblyAI supaya fail anda dan kandungannya tidak boleh diakses oleh sesiapa melainkan anda dan API yang ditranskripsikan.

Bahagian penting ialah bahagian terakhir URL, yang dalam contoh ini ialah 463ce27f-0922-4ea9-9ce4-3353d84b5638. Simpan pengecam unik ini kerana kita perlu menghantarnya ke skrip seterusnya yang memulakan perkhidmatan transkripsi.

Mulakan Transkripsi

Seterusnya, kami akan menulis beberapa kod untuk memulakan transkripsi. Cipta fail baharu bernama initial_transcription.py. Tambahkan kod berikut pada fail baharu.

import argparse  import os  import requests  API_URL = "https://api.assemblyai.com/v2/"  CDN_URL = "https://cdn.assemblyai.com/"  def initiate_transcription(file_id):      """Sends a request to the API to transcribe a specific      file that was previously uploaded to the API. This will      not immediately return the transcription because it takes      a moment for the service to analyze and perform the      transcription, so there is a different function to retrieve      the results.      """      endpoint = "".join([API_URL, "transcript"])      json = {"audio_url": "".join([CDN_URL, "upload/{}".format(file_id)])}      headers = {          "authorization": os.getenv("ASSEMBLYAI_KEY"),          "content-type": "application/json"      }      response = requests.post(endpoint, jsonjson=json, headersheaders=headers)      return response.json()

Salin selepas log masuk

Kami mempunyai import yang sama seperti skrip sebelumnya dan telah menambahkan CDN_URL pemalar baharu yang sepadan dengan URL berasingan tempat AssemblyAI menyimpan fail audio yang dimuat naik.

initiate_transcription函数本质上只是向AssemblyAI API设置了一个HTTP请求，以传入的特定URL对音频文件启动转录过程。这就是为什么file_id传递很重要的原因：完成音频文件的URL 我们告诉AssemblyAI进行检索。

通过附加此代码来完成文件，以便可以从命令行轻松地使用参数调用它。

if __name__ == "__main__":      parser = argparse.ArgumentParser()      parser.add_argument("file_id")      args = parser.parse_args()      file_id = args.file_id      response_json = initiate_transcription(file_id)      print(response_json)

Salin selepas log masuk

通过在initiate_transcription文件上运行python命令来启动脚本，并传入您在上一步中保存的唯一文件标识符。

# the FILE_IDENTIFIER is returned in the previous step and will  # look something like this: 463ce27f-0922-4ea9-9ce4-3353d84b5638  python initiate_transcription.py FILE_IDENTIFIER

Salin selepas log masuk

API将发回该脚本打印到命令行的JSON响应。

{'audio_end_at': None, 'acoustic_model': 'assemblyai_default', 'text': None,    'audio_url': 'https://cdn.assemblyai.com/upload/463ce27f-0922-4ea9-9ce4-3353d84b5638',    'speed_boost': False, 'language_model': 'assemblyai_default', 'redact_pii': False,    'confidence': None, 'webhook_status_code': None,    'id': 'gkuu2krb1-8c7f-4fe3-bb69-6b14a2cac067', 'status': 'queued', 'boost_param': None,    'words': None, 'format_text': True, 'webhook_url': None, 'punctuate': True,   'utterances': None, 'audio_duration': None, 'auto_highlights': False,    'word_boost': [], 'dual_channel': None, 'audio_start_from': None}

Salin selepas log masuk

记下JSON响应中id键的值。这是我们需要用来检索转录结果的转录标识符。在此示例中，它是gkuu2krb1-8c7f-4fe3-bb69-6b14a2cac067。复制转录标识符到您自己的响应中，因为在下一步中我们将需要它来检查转录过程何时完成。

检索转录结果

我们已经上传并开始了转录过程，因此，准备就绪后，我们将尽快获得结果。

返回结果所需的时间取决于文件的大小，因此下一个脚本将向HTTP发送一个HTTP请求，并报告转录状态，或者在完成后打印输出。

创建一个名为 get_transcription.py 的第三个Python文件，并将以下代码放入其中。

import argparse  import os  import requests  API_URL = "https://api.assemblyai.com/v2/"  def get_transcription(transcription_id):      """Requests the transcription from the API and returns the JSON      response."""      endpoint = "".join([API_URL, "transcript/{}".format(transcription_id)])      headers = {"authorization": os.getenv('ASSEMBLYAI_KEY')}      response = requests.get(endpoint, headersheaders=headers)     return response.json() if __name__ == "__main__":      parser = argparse.ArgumentParser()      parser.add_argument("transcription_id")      args = parser.parse_args()      transcription_id = args.transcription_id      response_json = get_transcription(transcription_id)      if response_json['status'] == "completed":          for word in response_json['words']:              print(word['text'], end=" ")      else:          print("current status of transcription request: {}".format(                response_json['status']))

Salin selepas log masuk

上面的代码与其他脚本具有相同的 imports 对象。在这个新的get_transcription函数中，我们只需使用我们的API密钥和上一步中的转录标识符（而不是文件标识符）调用AssemblyAI API。我们检索JSON响应并将其返回。

在main函数中，我们处理作为命令行参数传入的转录标识符，并将其传递给get_transcription函数。如果来自get_transcription函数的响应JSON包含completed状态，则我们将打印转录结果。否则，请在completed之前打印当前状态如queued或processing。

使用命令行和上一节中的转录标识符调用脚本：

python get_transcription.py TRANSCRIPTION_ID

Salin selepas log masuk

如果该服务尚未开始处理脚本，则它将返回queued，如下所示：

current status of transcription request: queued

Salin selepas log masuk

当服务当前正在处理音频文件时，它将返回processing：

current status of transcription request: processing

Salin selepas log masuk

该过程完成后，我们的脚本将返回转录文本，如您在此处看到的那样：

An object relational mapper is a code library that automates the transfer of   data stored in relational, databases into objects that are more commonly used  in application code or EMS are useful because they provide a high level   ...(output abbreviated)

Salin selepas log masuk

Atas ialah kandungan terperinci Bagaimana untuk menukar kandungan audio kepada format teks dalam Python. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan Laman Web ini

Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn

Alat AI Hot

Undresser.AI Undress

Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover

Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool

Gambar buka pakaian secara percuma

Clothoff.io

Penyingkiran pakaian AI

Video Face Swap

Tukar muka dalam mana-mana video dengan mudah menggunakan alat tukar muka AI percuma kami!

Tunjukkan Lagi

Artikel Panas

Assassin's Creed Shadows: Penyelesaian Riddle Seashell

3 minggu yang lalu By DDD

Apa yang Baru di Windows 11 KB5054979 & Cara Memperbaiki Masalah Kemas Kini

2 minggu yang lalu By DDD

Di mana untuk mencari kad kunci kawalan kren di atomfall

3 minggu yang lalu By DDD

<🎜>: Rails Dead - Cara Melengkapkan Setiap Cabaran

4 minggu yang lalu By DDD

Panduan Atomfall: Lokasi Item, Panduan Pencarian, dan Petua

1 bulan yang lalu By DDD

Tunjukkan Lagi

Alat panas

Notepad++7.3.1

Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina

Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1

Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6

Alat pembangunan web visual

SublimeText3 versi Mac

Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Tunjukkan Lagi

Topik panas

Di manakah pintu masuk log masuk untuk e-mel gmail?

7677

Tutorial CakePHP

1393

Tutorial C#

1207

Apakah format nama akaun stim

kunci pengaktifan win11 kekal

Tunjukkan Lagi

Related knowledge

PHP dan Python: Paradigma yang berbeza dijelaskan Apr 18, 2025 am 12:26 AM

PHP terutamanya pengaturcaraan prosedur, tetapi juga menyokong pengaturcaraan berorientasikan objek (OOP); Python menyokong pelbagai paradigma, termasuk pengaturcaraan OOP, fungsional dan prosedur. PHP sesuai untuk pembangunan web, dan Python sesuai untuk pelbagai aplikasi seperti analisis data dan pembelajaran mesin.

Memilih antara php dan python: panduan Apr 18, 2025 am 12:24 AM

PHP sesuai untuk pembangunan web dan prototaip pesat, dan Python sesuai untuk sains data dan pembelajaran mesin. 1.Php digunakan untuk pembangunan web dinamik, dengan sintaks mudah dan sesuai untuk pembangunan pesat. 2. Python mempunyai sintaks ringkas, sesuai untuk pelbagai bidang, dan mempunyai ekosistem perpustakaan yang kuat.

Python vs JavaScript: Keluk Pembelajaran dan Kemudahan Penggunaan Apr 16, 2025 am 12:12 AM

Python lebih sesuai untuk pemula, dengan lengkung pembelajaran yang lancar dan sintaks ringkas; JavaScript sesuai untuk pembangunan front-end, dengan lengkung pembelajaran yang curam dan sintaks yang fleksibel. 1. Sintaks Python adalah intuitif dan sesuai untuk sains data dan pembangunan back-end. 2. JavaScript adalah fleksibel dan digunakan secara meluas dalam pengaturcaraan depan dan pelayan.

Bolehkah kod studio visual digunakan dalam python Apr 15, 2025 pm 08:18 PM

Kod VS boleh digunakan untuk menulis Python dan menyediakan banyak ciri yang menjadikannya alat yang ideal untuk membangunkan aplikasi python. Ia membolehkan pengguna untuk: memasang sambungan python untuk mendapatkan fungsi seperti penyempurnaan kod, penonjolan sintaks, dan debugging. Gunakan debugger untuk mengesan kod langkah demi langkah, cari dan selesaikan kesilapan. Mengintegrasikan Git untuk Kawalan Versi. Gunakan alat pemformatan kod untuk mengekalkan konsistensi kod. Gunakan alat linting untuk melihat masalah yang berpotensi lebih awal.

Boleh kod vs dijalankan di Windows 8 Apr 15, 2025 pm 07:24 PM

Kod VS boleh dijalankan pada Windows 8, tetapi pengalaman mungkin tidak hebat. Mula -mula pastikan sistem telah dikemas kini ke patch terkini, kemudian muat turun pakej pemasangan kod VS yang sepadan dengan seni bina sistem dan pasangnya seperti yang diminta. Selepas pemasangan, sedar bahawa beberapa sambungan mungkin tidak sesuai dengan Windows 8 dan perlu mencari sambungan alternatif atau menggunakan sistem Windows yang lebih baru dalam mesin maya. Pasang sambungan yang diperlukan untuk memeriksa sama ada ia berfungsi dengan betul. Walaupun kod VS boleh dilaksanakan pada Windows 8, disyorkan untuk menaik taraf ke sistem Windows yang lebih baru untuk pengalaman dan keselamatan pembangunan yang lebih baik.

Adakah sambungan vscode berniat jahat? Apr 15, 2025 pm 07:57 PM

Sambungan kod VS menimbulkan risiko yang berniat jahat, seperti menyembunyikan kod jahat, mengeksploitasi kelemahan, dan melancap sebagai sambungan yang sah. Kaedah untuk mengenal pasti sambungan yang berniat jahat termasuk: memeriksa penerbit, membaca komen, memeriksa kod, dan memasang dengan berhati -hati. Langkah -langkah keselamatan juga termasuk: kesedaran keselamatan, tabiat yang baik, kemas kini tetap dan perisian antivirus.

PHP dan Python: menyelam mendalam ke dalam sejarah mereka Apr 18, 2025 am 12:25 AM

PHP berasal pada tahun 1994 dan dibangunkan oleh Rasmuslerdorf. Ia pada asalnya digunakan untuk mengesan pelawat laman web dan secara beransur-ansur berkembang menjadi bahasa skrip sisi pelayan dan digunakan secara meluas dalam pembangunan web. Python telah dibangunkan oleh Guidovan Rossum pada akhir 1980 -an dan pertama kali dikeluarkan pada tahun 1991. Ia menekankan kebolehbacaan dan kesederhanaan kod, dan sesuai untuk pengkomputeran saintifik, analisis data dan bidang lain.

Cara menjalankan program di terminal vscode Apr 15, 2025 pm 06:42 PM

Dalam kod VS, anda boleh menjalankan program di terminal melalui langkah -langkah berikut: Sediakan kod dan buka terminal bersepadu untuk memastikan bahawa direktori kod selaras dengan direktori kerja terminal. Pilih arahan Run mengikut bahasa pengaturcaraan (seperti python python your_file_name.py) untuk memeriksa sama ada ia berjalan dengan jayanya dan menyelesaikan kesilapan. Gunakan debugger untuk meningkatkan kecekapan debug.

See all articles