Mit der Entwicklung der Technologie der künstlichen Intelligenz wird die Spracherkennung immer ausgereifter und beliebter. Die Google Cloud Speech-to-Text API ist ein leistungsstarker Spracherkennungsdienst, der Entwickler bei der Spracherkennung und -konvertierung unterstützt. In diesem Artikel besprechen wir, wie Sie die Google Cloud Speech-to-Text-API in PHP für die Textkonvertierung und -analyse verwenden.
Bevor Sie die Google Cloud Speech-to-Text-API verwenden, müssen Sie die folgenden Dinge erledigen:
a. Besorgen Sie sich den Zugriffsschlüssel für Google Cloud. Google Cloud bietet einen kostenlosen Testzeitraum an, in dem Sie die Speech-to-Text-API kostenlos nutzen können. Nach Ablauf des Testzeitraums müssen Sie jedoch einen Google Cloud-Serviceplan erwerben, um die Speech-to-Text-API weiterhin nutzen zu können.
b. Installieren Sie PHP 7 oder neuer. Google Cloud stellt eine PHP-Version der Spracherkennungsbibliothek bereit. Für diese Version ist PHP 7 oder höher erforderlich.
c. Laden Sie das Google Cloud SDK herunter und installieren Sie es. Google Cloud SDK ist ein Befehlszeilentool, das Sie bei der Verwaltung von Ressourcen und Diensten auf der Google Cloud-Plattform unterstützt.
Bevor Sie die Google Cloud Speech-to-Text-API für die Spracherkennung verwenden, müssen Sie eine Google Cloud-Authentifizierung einrichten. Durch diese Authentifizierung erhält Ihre Anwendung Zugriff auf Google Cloud-Dienste. Sie können den folgenden Befehlszeilenbefehl verwenden, um ein neues Dienstkonto zu erstellen:
gcloud iam service-accounts create [ACCOUNT_NAME]
wobei [ACCOUNT_NAME]
der Name ist, den Sie für dieses Konto festgelegt haben. [ACCOUNT_NAME]
是你给这个账号设定的名字。
创建了一个新的服务账号之后,你需要给它授权。这样,你的应用程序就能够使用 Speech-to-Text API。你可以使用以下的命令行指令授权:
gcloud projects add-iam-policy-binding [PROJECT_ID] --member "serviceAccount:[ACCOUNT_NAME]@[PROJECT_ID].iam.gserviceaccount.com" --role "roles/cloudspeechto-text.admin"
在这里,[PROJECT_ID]
代表 Google Cloud 中你的项目 ID。你需要将[PROJECT_ID]
替换为你的项目 ID。[ACCOUNT_NAME]@[PROJECT_ID].iam.gserviceaccount.com
是你在步骤 2.1 中创建的服务账号的名字。这个账号会被授予 roles/cloudspeech-to-text.admin
的权限,这意味着他可以管理语音识别服务。
最后,你需要为你的服务账号创建一个访问密钥。你可以通过以下的命令行指令创建密钥:
gcloud iam service-accounts keys create [KEY_FILE_NAME].json --iam-account [ACCOUNT_NAME]@[PROJECT_ID].iam.gserviceaccount.com
这条命令会创建一个新的 JSON 文件,其中包含了你的 Google Cloud 服务账号的私有密钥。在 PHP 中使用 Speech-to-Text API 时,你需要使用这个密钥进行身份验证。
完成了 Google Cloud 认证之后,我们可以开始在 PHP 中使用 Speech-to-Text API 进行语音识别。首先,你需要下载并安装 Google Cloud 的 PHP 语音识别库。你可以使用以下的 Composer 命令进行安装:
composer require google/cloud-speech
安装完成后,你需要在你的 PHP 文件中包含以下的代码:
<?php require 'vendor/autoload.php'; use GoogleCloudSpeechV1SpeechClient; use GoogleCloudSpeechV1RecognitionAudio; use GoogleCloudSpeechV1RecognitionConfig; $options = [ 'credentials' => 'PATH_TO_YOUR_JSON_FILE' ]; $speech = new SpeechClient($options); $audioFile = file_get_contents('PATH_TO_YOUR_AUDIO_FILE'); $audio = (new RecognitionAudio())->setContent($audioFile); $config = new RecognitionConfig([ 'encoding' => 'ENCODING_TYPE_USED_BY_YOUR_AUDIO_FILE', 'sampleRateHertz' => SAMPLE_RATE_HERTZ_OF_YOUR_AUDIO_FILE, 'languageCode' => 'LANGUAGE_CODE' ]);
在上面的例子中,PATH_TO_YOUR_JSON_FILE
是你在步骤 2.3 中创建的服务账号的 JSON 文件存放的路径。PATH_TO_YOUR_AUDIO_FILE
是你要进行语音识别的音频文件存放的路径。ENCODING_TYPE_USED_BY_YOUR_AUDIO_FILE
是你要进行语音识别的音频文件的编码类型。SAMPLE_RATE_HERTZ_OF_YOUR_AUDIO_FILE
是你要进行语音识别的音频文件的采样率。LANGUAGE_CODE
是你要识别的语言代码。
现在,我们可以使用 Speech-to-Text API 进行语音识别。你可以使用以下的命令进行识别:
$response = $speech->recognize($config, $audio); foreach ($response->getResults() as $result) { echo $result->getAlternatives()[0]->getTranscript() . " "; }
在上面的代码中,$response = $speech->recognize($config, $audio);
将音频文件提交给 Speech-to-Text API 进行语音识别。 $result->getAlternatives()[0]->getTranscript()
[PROJECT_ID]
Ihre Projekt-ID in Google Cloud dar. Sie müssen [PROJECT_ID]
durch Ihre Projekt-ID ersetzen. [ACCOUNT_NAME]@[PROJECT_ID].iam.gserviceaccount.com
ist der Name des Dienstkontos, das Sie in Schritt 2.1 erstellt haben. Diesem Konto werden roles/cloudspeech-to-text.admin
-Berechtigungen gewährt, was bedeutet, dass er den Spracherkennungsdienst verwalten kann. rrreee
Dieser Befehl erstellt eine neue JSON-Datei, die den privaten Schlüssel Ihres Google Cloud-Dienstkontos enthält. Wenn Sie die Speech-to-Text-API in PHP verwenden, müssen Sie sich mit diesem Schlüssel authentifizieren. 🎜PATH_TO_YOUR_JSON_FILE
Ihr Verzeichnis Der Pfad, in dem die JSON-Datei des in Schritt 2.3 erstellten Dienstkontos gespeichert ist. PATH_TO_YOUR_AUDIO_FILE
ist der Pfad, in dem die Audiodateien gespeichert werden, für die Sie eine Spracherkennung durchführen möchten. ENCODING_TYPE_USED_BY_YOUR_AUDIO_FILE
ist der Kodierungstyp der Audiodatei, für die Sie eine Spracherkennung durchführen möchten. SAMPLE_RATE_HERTZ_OF_YOUR_AUDIO_FILE
ist die Abtastrate der Audiodatei, für die Sie eine Spracherkennung durchführen möchten. LANGUAGE_CODE
ist der Sprachcode, den Sie erkennen möchten. 🎜🎜Jetzt können wir die Speech-to-Text-API für die Spracherkennung verwenden. Sie können den folgenden Befehl zur Erkennung verwenden: 🎜rrreee🎜Im obigen Code $response = $speech->recognize($config, $audio);
senden Sie die Audiodatei an Speech-to – Text-API zur Spracherkennung. $result->getAlternatives()[0]->getTranscript()
Greifen Sie auf das erste Element des Rückgabewert-Arrays zu und rufen Sie den Transkripttext ab. 🎜🎜🎜Fazit🎜🎜🎜In diesem Artikel haben wir gelernt, wie man die Google Cloud Speech-to-Text API in PHP für die Spracherkennung und -konvertierung verwendet. Wir haben besprochen, wie man die Authentifizierung mit Google Cloud einrichtet, wie man die PHP-Spracherkennungsbibliothek von Google Cloud herunterlädt und wie man die Speech-to-Text-API für die Spracherkennung verwendet. Ich hoffe, dieser Artikel kann Ihnen helfen, die Google Cloud Speech-to-Text API besser zu verstehen und zu verwenden. 🎜Das obige ist der detaillierte Inhalt vonSo verwenden Sie die Google Cloud Speech-to-Text-API in PHP für die Textkonvertierung und -analyse. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!