Python を使用して Baidu AI インターフェイスに接続し、プログラムをより興味深いものにします-Python チュートリアル-php.cn

Python を使用して Baidu AI インターフェイスに接続し、プログラムをより興味深いものにします

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

リリース： 2023-08-12 08:27:25

オリジナル

1701 人が閲覧しました

Python を使用して Baidu AI インターフェイスに接続し、プログラムをより興味深いものにします

Python を使用して Baidu AI インターフェイスに接続し、プログラムをより面白くしましょう

人工知能の発展に伴い、API (アプリケーションプログラムインターフェイス) はさまざまなものになりました。ソフトウェア開発者向けの標準ツール。 API はソフトウェアにさまざまな機能を提供し、プログラムをよりインテリジェントで興味深いものにします。 Baidu AI インターフェイスは現在、開発者の間で最も人気のあるインターフェイスの 1 つです。この記事では、Python を使用して Baidu AI インターフェイスに接続し、プログラムをより面白くする方法を紹介します。

まず、Baidu AI Open Platform (https://ai.baidu.com/) にアカウントを登録し、アプリケーションを作成する必要があります。作成が成功すると、Python プログラムで使用する API キーと秘密キーを取得します。

次に、Baidu AI のテキスト認識インターフェイスと音声合成インターフェイスを例として使用します。

テキスト認識インターフェイス

テキスト認識インターフェイスは、画像からテキストを抽出でき、自動ドキュメントスキャンやライブラリ管理などのシナリオに適用できます。

まず、Baidu AI の Python SDK をインストールし、ターミナルで次のコマンドを入力する必要があります:

pip install baidu-aip

ログイン後にコピー

次に、関連するライブラリを Python プログラムにインポートします:

from aip import AipOcr

ログイン後にコピー

続行次に、Baidu AI Open Platform から取得した API キー、秘密キー、およびアプリケーション ID を次のコードに入力します:

APP_ID = 'your app id'
API_KEY = 'your api key'
SECRET_KEY = 'your secret key'

client = AipOcr(APP_ID, API_KEY, SECRET_KEY)

ログイン後にコピー

ここで、上で作成したオブジェクトを使用して、画像内のテキストを識別できます。。「image.png」という名前の画像があるとします。テキスト認識には次のコードを使用できます。

def get_file_content(file_path):
    with open(file_path, 'rb') as fp:
        return fp.read()

image = get_file_content("image.png")

result = client.basicGeneral(image)
for word in result['words_result']:
    print(word['words'])

ログイン後にコピー

上記のコードは、まず関数 get_file_content を定義します。これは、Get を読み取るために使用されます。画像の内容。次に、画像コンテンツをテキスト認識インターフェイスの basicGeneral メソッドに渡し、返された結果を調べて、認識されたテキストを出力します。

音声合成インターフェース

音声合成インターフェースは、テキストを音声に変換し、音色や話す速度を設定できます。読書ソフトウェアやスマートアシスタントなどのシナリオに適用できます。

同様に、Baidu AI の Python SDK をインストールし、関連するライブラリをインポートする必要があります:

from aip import AipSpeech

ログイン後にコピー

次に、Baidu AI オープンプラットフォームで取得した API キー、秘密キー、アプリケーション ID を入力します。次のコードを入力します。

APP_ID = 'your app id'
API_KEY = 'your api key'
SECRET_KEY = 'your secret key'

client = AipSpeech(APP_ID, API_KEY, SECRET_KEY)

ログイン後にコピー

テキストの一部を音声に合成したいとします。次のコードを使用できます。

text = "欢迎来到百度AI开放平台"

result = client.synthesis(text, 'zh', 1, {
    'vol': 5,
    'per': 4,
})

if not isinstance(result, dict):
    with open('audio.mp3', 'wb') as f:
        f.write(result)

ログイン後にコピー

上記のコードは、「Baidu AI へようこそ」というテキストを渡します。 Open Platform」音声合成インターフェースの合成メソッドを指定し、言語を中国語、音量を 5、音色を Du Xiaoyao に設定します。次に、返された音声コンテンツをファイル「audio.mp3」に書き込みます。

Baidu AI インターフェースと接続することで、プログラムにさらに興味深い機能を持たせることができます。テキスト認識インターフェイスを使用すると、プログラムは画像内のテキスト情報を読み取ることができ、音声合成インターフェイスを使用すると、プログラムは音声を出力できます。 Baidu AI インターフェイスを使用すると、プログラムにさらに楽しさとインテリジェンスを追加できます。

以上がPython を使用して Baidu AI インターフェイスに接続し、プログラムをより興味深いものにしますの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。