如何使用OpenAI文本到語音API-人工智慧-PHP中文網

如何使用OpenAI文本到語音API

Joseph Gordon-Levitt

發布： 2025-03-09 10:25:18

原創

547 人瀏覽過

>解鎖Openai的文本到語音API的功能：綜合指南

想像一下花費無數小時的製作引人注目的內容，只是因為觀眾參與度有限而意識到其巨大的潛力沒有開發。許多讀者根本沒有時間進行冗長的文章。僱用敘述者是昂貴且耗時的。輸入OpenAI的文本到語音（TTS）API - 一種彌合此差距的技術解決方案。本教程探討了OpenAI的TTS API，其功能，實現，自定義和不同的應用程序。

什麼是OpenAi的TTS API？

> OpenAI的TTS API是一種強大的工具，可將書面文本轉換為自然的演講。這種文本到語音（TTS）技術採用數字文本並將其轉換為可聽見的敘述。 Openai提供了兩個尖端的型號：

> tts-1：針對實時語音生成進行了優化。 >
> tts-1-HD：優先級優先音頻質量。

API擁有六個不同的聲音，並支持各種功能，包括：

敘述博客文章和文章。

創建多語言音頻內容。
生成實時音頻流。

開始使用OpenAi TTS API

這是使用OpenAI TTS API的分步指南：

>先決條件：

>一個資助的OpenAI帳戶（請參見下面的定價）。 python 3.7或更高。

一個集成的開發環境（IDE）。

步驟1：獲取您的API鍵
>

步驟2：設置虛擬環境

> How to use the OpenAI Text-to-Speech API 創建一個虛擬環境來隔離項目依賴性。（有關詳細說明，請參閱Python虛擬環境教程。）

步驟3：python代碼>

API需要三個關鍵輸入：模型名稱，文本和語音。使用OpenAI的樣本請求作為基礎：

>步驟4：安全管理您的API鍵

而不是硬編碼您的API鍵，而是使用

庫安全地管理它。

from pathlib import Path
from openai import OpenAI
from dotenv import load_dotenv
import os

load_dotenv()
SECRET_KEY = os.getenv("SECRET_KEY")

client = OpenAI(api_key=SECRET_KEY)

speech_file_path = Path(__file__).parent / "speech.mp3"
response = client.audio.speech.create(
  model="tts-1",
  voice="alloy",
  input="Today is a wonderful day to build something people love!"
)

response.stream_to_file(speech_file_path)

登入後複製

> install：

python-dotenv創建一個

文件：