Dengan perkembangan teknologi kecerdasan buatan, pengecaman pertuturan menjadi semakin matang dan popular. API Pertuturan-ke-Teks Awan Google ialah perkhidmatan pengecaman pertuturan yang berkuasa yang membantu pembangun melakukan pengecaman dan penukaran pertuturan. Dalam artikel ini, kami akan membincangkan cara menggunakan API Google Cloud Speech-to-Text dalam PHP untuk penukaran dan analisis teks.
Sebelum menggunakan Google Cloud Speech-to-Text API, anda perlu melengkapkan perkara berikut:
a. Google Cloud menawarkan tempoh percubaan percuma di mana anda boleh menggunakan API Pertuturan ke Teks secara percuma. Walau bagaimanapun, selepas tempoh percubaan tamat, anda perlu membeli pelan perkhidmatan Google Cloud untuk terus menggunakan API Pertuturan ke Teks.
b. Pasang PHP 7 atau lebih baharu. Google Cloud menyediakan versi PHP pustaka pengecaman pertuturan, dan versi ini memerlukan PHP 7 atau lebih baharu.
c. Muat turun dan pasang Google Cloud SDK. SDK Awan Google ialah alat baris perintah yang membantu anda mengurus sumber dan perkhidmatan pada platform Awan Google.
Sebelum menggunakan API Google Cloud Speech-to-Text untuk pengecaman pertuturan, anda perlu mewujudkan pengesahan Google Cloud. Pengesahan ini akan memberikan aplikasi anda akses kepada perkhidmatan Google Cloud. Anda boleh menggunakan arahan baris arahan berikut untuk membuat akaun perkhidmatan baharu:
gcloud iam service-accounts create [ACCOUNT_NAME]
di mana [ACCOUNT_NAME]
ialah nama yang anda tetapkan untuk akaun ini. [ACCOUNT_NAME]
是你给这个账号设定的名字。
创建了一个新的服务账号之后,你需要给它授权。这样,你的应用程序就能够使用 Speech-to-Text API。你可以使用以下的命令行指令授权:
gcloud projects add-iam-policy-binding [PROJECT_ID] --member "serviceAccount:[ACCOUNT_NAME]@[PROJECT_ID].iam.gserviceaccount.com" --role "roles/cloudspeechto-text.admin"
在这里,[PROJECT_ID]
代表 Google Cloud 中你的项目 ID。你需要将[PROJECT_ID]
替换为你的项目 ID。[ACCOUNT_NAME]@[PROJECT_ID].iam.gserviceaccount.com
是你在步骤 2.1 中创建的服务账号的名字。这个账号会被授予 roles/cloudspeech-to-text.admin
的权限,这意味着他可以管理语音识别服务。
最后,你需要为你的服务账号创建一个访问密钥。你可以通过以下的命令行指令创建密钥:
gcloud iam service-accounts keys create [KEY_FILE_NAME].json --iam-account [ACCOUNT_NAME]@[PROJECT_ID].iam.gserviceaccount.com
这条命令会创建一个新的 JSON 文件,其中包含了你的 Google Cloud 服务账号的私有密钥。在 PHP 中使用 Speech-to-Text API 时,你需要使用这个密钥进行身份验证。
完成了 Google Cloud 认证之后,我们可以开始在 PHP 中使用 Speech-to-Text API 进行语音识别。首先,你需要下载并安装 Google Cloud 的 PHP 语音识别库。你可以使用以下的 Composer 命令进行安装:
composer require google/cloud-speech
安装完成后,你需要在你的 PHP 文件中包含以下的代码:
<?php require 'vendor/autoload.php'; use GoogleCloudSpeechV1SpeechClient; use GoogleCloudSpeechV1RecognitionAudio; use GoogleCloudSpeechV1RecognitionConfig; $options = [ 'credentials' => 'PATH_TO_YOUR_JSON_FILE' ]; $speech = new SpeechClient($options); $audioFile = file_get_contents('PATH_TO_YOUR_AUDIO_FILE'); $audio = (new RecognitionAudio())->setContent($audioFile); $config = new RecognitionConfig([ 'encoding' => 'ENCODING_TYPE_USED_BY_YOUR_AUDIO_FILE', 'sampleRateHertz' => SAMPLE_RATE_HERTZ_OF_YOUR_AUDIO_FILE, 'languageCode' => 'LANGUAGE_CODE' ]);
在上面的例子中,PATH_TO_YOUR_JSON_FILE
是你在步骤 2.3 中创建的服务账号的 JSON 文件存放的路径。PATH_TO_YOUR_AUDIO_FILE
是你要进行语音识别的音频文件存放的路径。ENCODING_TYPE_USED_BY_YOUR_AUDIO_FILE
是你要进行语音识别的音频文件的编码类型。SAMPLE_RATE_HERTZ_OF_YOUR_AUDIO_FILE
是你要进行语音识别的音频文件的采样率。LANGUAGE_CODE
是你要识别的语言代码。
现在,我们可以使用 Speech-to-Text API 进行语音识别。你可以使用以下的命令进行识别:
$response = $speech->recognize($config, $audio); foreach ($response->getResults() as $result) { echo $result->getAlternatives()[0]->getTranscript() . " "; }
在上面的代码中,$response = $speech->recognize($config, $audio);
将音频文件提交给 Speech-to-Text API 进行语音识别。 $result->getAlternatives()[0]->getTranscript()
[PROJECT_ID]
mewakili ID projek anda dalam Google Cloud. Anda perlu menggantikan [PROJECT_ID]
dengan ID projek anda. [ACCOUNT_NAME]@[PROJECT_ID].iam.gserviceaccount.com
ialah nama akaun perkhidmatan yang anda buat dalam langkah 2.1. Akaun ini akan diberikan kebenaran roles/cloudspeech-to-text.admin
, yang bermaksud dia boleh mengurus perkhidmatan pengecaman pertuturan. rrreee
Arahan ini akan mencipta fail JSON baharu yang mengandungi kunci peribadi akaun perkhidmatan Google Cloud anda. Apabila menggunakan API Ucapan-ke-Teks dalam PHP, anda perlu mengesahkan menggunakan kunci ini. 🎜PATH_TO_YOUR_JSON_FILE
ialah tempat anda Laluan di mana fail JSON akaun perkhidmatan yang dibuat dalam langkah 2.3 disimpan. PATH_TO_YOUR_AUDIO_FILE
ialah laluan di mana fail audio yang anda mahu lakukan pengecaman pertuturan disimpan. ENCODING_TYPE_USED_BY_YOUR_AUDIO_FILE
ialah jenis pengekodan fail audio yang anda mahu lakukan pengecaman pertuturan. SAMPLE_RATE_HERTZ_OF_YOUR_AUDIO_FILE
ialah kadar pensampelan fail audio yang anda mahu lakukan pengecaman pertuturan. LANGUAGE_CODE
ialah kod bahasa yang ingin anda kenali. 🎜🎜Kini, kita boleh menggunakan API Pertuturan ke Teks untuk pengecaman pertuturan. Anda boleh menggunakan arahan berikut untuk pengecaman: 🎜rrreee🎜Dalam kod di atas, $response = $speech->recognize($config, $audio);
serahkan fail audio ke Speech-to - API teks untuk pengecaman pertuturan. $result->getAlternatives()[0]->getTranscript()
Akses item pertama tatasusunan nilai pulangan dan dapatkan teks transkrip. 🎜🎜🎜Kesimpulan🎜🎜🎜Dalam artikel ini, kami mempelajari cara menggunakan API Google Cloud Speech-to-Text dalam PHP untuk pengecaman dan penukaran pertuturan. Kami membincangkan cara menyediakan pengesahan dengan Google Cloud, cara memuat turun pustaka pengecaman pertuturan PHP Google Cloud dan cara menggunakan API Pertuturan ke Teks untuk pengecaman pertuturan. Saya harap artikel ini dapat membantu anda memahami dengan lebih baik dan menggunakan API Pertuturan-ke-Teks Awan Google. 🎜Atas ialah kandungan terperinci Cara menggunakan API Google Cloud Speech-to-Text dalam PHP untuk penukaran dan analisis teks. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!