Python で音声を録音する方法: 音声と沈黙を自動的に検出する-Python チュートリアル-php.cn

ホームページ

バックエンド開発

Python チュートリアル

Python で音声を録音する方法: 音声と沈黙を自動的に検出する

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

Aug 29, 2024 pm 08:30 PM

How to Record Audio in Python: Automatically Detect Speech and Silence

誰かが話しているときのみ音声を録音することは、音声起動アシスタントから無音期間を排除してストレージ容量を節約するまで、さまざまなアプリケーションで使用できる強力な機能です。このチュートリアルでは、音声を検出すると録音を開始し、無音を検出すると停止する Python コードの作成方法を学習します。

前提条件

実際に始める前に、以下のものがあることを確認してください:

Python 3.x がシステムにインストールされています。
Python の基礎知識
pyaudio、numpy、webrtcvad などの Python ライブラリに関する知識。

ステップ 1: 必要なライブラリをインストールしますか?

次のライブラリを使用します:

pyaudio: マイクから音声をキャプチャします。
webrtcvad: 音声アクティビティ検出用。
numpy: 音声データを処理するため。

pip を使用してインストールできます:

pip install pyaudio webrtcvad numpy

ログイン後にコピー

ステップ 2: オーディオストリームを設定しますか?

まず、マイクからの音声入力をキャプチャするためにオーディオストリームを設定しましょう。

import pyaudio

# Audio configuration
FORMAT = pyaudio.paInt16
CHANNELS = 1
RATE = 16000
CHUNK = 1024

# Initialize PyAudio
audio = pyaudio.PyAudio()

# Open stream
stream = audio.open(format=FORMAT,
                    channels=CHANNELS,
                    rate=RATE,
                    input=True,
                    frames_per_buffer=CHUNK)

ログイン後にコピー

ステップ 3: 音声アクティビティ検出 (VAD) を実装しますか?

webrtcvad ライブラリを使用して、誰かが話していることを検出します。ライブラリはオーディオフレームを音声または非音声として分類できます。

import webrtcvad

# Initialize VAD
vad = webrtcvad.Vad()
vad.set_mode(1)  # 0: Aggressive filtering, 3: Less aggressive

def is_speech(frame, sample_rate):
    return vad.is_speech(frame, sample_rate)

ログイン後にコピー

ステップ 4: オーディオフレームのキャプチャと処理 ?

ここで、音声フレームを継続的にキャプチャして、音声が含まれているかどうかを確認してみましょう。

def record_audio():
    frames = []
    recording = False

    print("Listening for speech...")

    while True:
        frame = stream.read(CHUNK)

        if is_speech(frame, RATE):
            if not recording:
                print("Recording started.")
                recording = True
            frames.append(frame)
        else:
            if recording:
                print("Silence detected, stopping recording.")
                break

    # Stop and close the stream
    stream.stop_stream()
    stream.close()
    audio.terminate()

    return frames

ログイン後にコピー

ステップ 5: 録音した音声を保存しますか?

最後に、録音したオーディオを .wav ファイルに保存しましょう。

import wave

def save_audio(frames, filename="output.wav"):
    wf = wave.open(filename, 'wb')
    wf.setnchannels(CHANNELS)
    wf.setsampwidth(audio.get_sample_size(FORMAT))
    wf.setframerate(RATE)
    wf.writeframes(b''.join(frames))
    wf.close()

# Example usage
frames = record_audio()
save_audio(frames)
print("Audio saved as output.wav")

ログイン後にコピー

結論？

わずか数行のコードで、音声を検出し、沈黙を無視して話している部分のみを記録する Python プログラムを実装できました。このテクニックは、効率的な音声起動システムを作成する場合に特に役立ちます。

特定のニーズに合わせて、VAD の積極性とオーディオ設定を自由に試してみてください。コーディングを楽しんでください! ?‍??‍?

以上がPython で音声を録音する方法: 音声と沈黙を自動的に検出するの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

このウェブサイトの声明

この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

ホットAIツール

Video Face Swap

完全無料の AI 顔交換ツールを使用して、あらゆるビデオの顔を簡単に交換できます。

ホットツール

ホットトピック

Java チュートリアル

1674

CakePHP チュートリアル

1429

Laravel チュートリアル

1333

PHP チュートリアル

1278

C# チュートリアル

1257

Related knowledge

Python vs. C：曲線と使いやすさの学習 Apr 19, 2025 am 12:20 AM

Pythonは学習と使用が簡単ですが、Cはより強力ですが複雑です。 1。Python構文は簡潔で初心者に適しています。動的なタイピングと自動メモリ管理により、使いやすくなりますが、ランタイムエラーを引き起こす可能性があります。 2.Cは、高性能アプリケーションに適した低レベルの制御と高度な機能を提供しますが、学習しきい値が高く、手動メモリとタイプの安全管理が必要です。

Pythonの学習：2時間の毎日の研究で十分ですか？ Apr 18, 2025 am 12:22 AM

Pythonを1日2時間学ぶだけで十分ですか？それはあなたの目標と学習方法に依存します。 1）明確な学習計画を策定し、2）適切な学習リソースと方法を選択します。3）実践的な実践とレビューとレビューと統合を練習および統合し、統合すると、この期間中にPythonの基本的な知識と高度な機能を徐々に習得できます。

Python vs. C：パフォーマンスと効率の探索 Apr 18, 2025 am 12:20 AM

Pythonは開発効率でCよりも優れていますが、Cは実行パフォーマンスが高くなっています。 1。Pythonの簡潔な構文とリッチライブラリは、開発効率を向上させます。 2.Cのコンピレーションタイプの特性とハードウェア制御により、実行パフォーマンスが向上します。選択を行うときは、プロジェクトのニーズに基づいて開発速度と実行効率を比較検討する必要があります。

Python vs. C：重要な違いを理解します Apr 21, 2025 am 12:18 AM

PythonとCにはそれぞれ独自の利点があり、選択はプロジェクトの要件に基づいている必要があります。 1）Pythonは、簡潔な構文と動的タイピングのため、迅速な開発とデータ処理に適しています。 2）Cは、静的なタイピングと手動メモリ管理により、高性能およびシステムプログラミングに適しています。

Python Standard Libraryの一部はどれですか：リストまたは配列はどれですか？ Apr 27, 2025 am 12:03 AM

PythonListSarePartOfThestAndardarenot.liestareBuilting-in、versatile、forStoringCollectionsのpythonlistarepart。

Python：自動化、スクリプト、およびタスク管理 Apr 16, 2025 am 12:14 AM

Pythonは、自動化、スクリプト、およびタスク管理に優れています。 1）自動化：OSやShutilなどの標準ライブラリを介してファイルバックアップが実現されます。 2）スクリプトの書き込み：Psutilライブラリを使用してシステムリソースを監視します。 3）タスク管理：スケジュールライブラリを使用してタスクをスケジュールします。 Pythonの使いやすさと豊富なライブラリサポートにより、これらの分野で優先ツールになります。

科学コンピューティングのためのPython：詳細な外観 Apr 19, 2025 am 12:15 AM

科学コンピューティングにおけるPythonのアプリケーションには、データ分析、機械学習、数値シミュレーション、視覚化が含まれます。 1.numpyは、効率的な多次元配列と数学的関数を提供します。 2。ScipyはNumpy機能を拡張し、最適化と線形代数ツールを提供します。 3. Pandasは、データ処理と分析に使用されます。 4.matplotlibは、さまざまなグラフと視覚的な結果を生成するために使用されます。

Web開発用のPython：主要なアプリケーション Apr 18, 2025 am 12:20 AM

Web開発におけるPythonの主要なアプリケーションには、DjangoおよびFlaskフレームワークの使用、API開発、データ分析と視覚化、機械学習とAI、およびパフォーマンスの最適化が含まれます。 1。DjangoandFlask Framework：Djangoは、複雑な用途の迅速な発展に適しており、Flaskは小規模または高度にカスタマイズされたプロジェクトに適しています。 2。API開発：フラスコまたはdjangorestFrameworkを使用して、Restfulapiを構築します。 3。データ分析と視覚化：Pythonを使用してデータを処理し、Webインターフェイスを介して表示します。 4。機械学習とAI：Pythonは、インテリジェントWebアプリケーションを構築するために使用されます。 5。パフォーマンスの最適化：非同期プログラミング、キャッシュ、コードを通じて最適化

See all articles

Python で音声を録音する方法: 音声と沈黙を自動的に検出する

前提条件

ステップ 1: 必要なライブラリをインストールしますか?

ステップ 2: オーディオストリームを設定しますか?

ステップ 3: 音声アクティビティ検出 (VAD) を実装しますか?

ステップ 4: オーディオフレームのキャプチャと処理 ?

ステップ 5: 録音した音声を保存しますか?

結論？

ホットAIツール

Undresser.AI Undress

AI Clothes Remover

Undress AI Tool

Clothoff.io

Video Face Swap

人気の記事

ホットツール

メモ帳++7.3.1

SublimeText3 中国語版

ゼンドスタジオ 13.0.1

ドリームウィーバー CS6

SublimeText3 Mac版

ホットトピック

Python で音声を録音する方法: 音声と沈黙を自動的に検出する

前提条件

ステップ 1: 必要なライブラリをインストールしますか?

ステップ 2: オーディオ ストリームを設定しますか?

ステップ 3: 音声アクティビティ検出 (VAD) を実装しますか?

ステップ 4: オーディオ フレームのキャプチャと処理 ?

ステップ 5: 録音した音声を保存しますか?

結論 ？

ホットAIツール

Undresser.AI Undress

AI Clothes Remover

Undress AI Tool

Clothoff.io

Video Face Swap

人気の記事

ホットツール

メモ帳++7.3.1

SublimeText3 中国語版

ゼンドスタジオ 13.0.1

ドリームウィーバー CS6

SublimeText3 Mac版

ホットトピック

ステップ 2: オーディオストリームを設定しますか?

ステップ 4: オーディオフレームのキャプチャと処理 ?

結論？