Golang melaksanakan sembang suara

WBOY
Lepaskan: 2023-05-13 09:37:06
asal
1135 orang telah melayarinya

Dengan kemajuan teknologi yang berterusan, komunikasi suara telah menjadi bahagian penting dalam kehidupan orang ramai Hari ini, sembang suara telah menjadi salah satu kaedah komunikasi yang paling biasa di Internet. Oleh itu, adalah perlu untuk menyepadukan fungsi sembang suara ke dalam aplikasi supaya pengguna boleh berkomunikasi dengan mudah melalui suara. Golang ialah bahasa pengaturcaraan yang sangat baik Ia cekap, pantas dan boleh dipercayai, jadi menggunakan golang untuk melaksanakan fungsi sembang suara akan menjadi pilihan yang sangat baik. Dalam artikel ini, kami akan memperkenalkan cara menggunakan golang untuk melaksanakan fungsi sembang suara.

1. Tetapan persekitaran

Sebelum mula melaksanakan fungsi sembang suara, anda perlu memasang persekitaran pembangunan bahasa golang pada komputer anda. Selepas pemasangan, anda perlu menggunakan arahan go get untuk memasang beberapa perpustakaan berkaitan suara, termasuk:

  1. github.com/gordonklaus/portaudio: Perpustakaan audio PortAudio
  2. github.com /faiface /beep: perpustakaan audio bip
  3. github.com/faiface/gui: perpustakaan antara muka pengguna gui
  4. github.com/gordonklaus/audiowaveform: Pustaka bentuk gelombang gelombang

Pustaka ini boleh dipasang dengan cepat menggunakan arahan go get. Sebagai contoh, arahan go get github.com/gordonklaus/portaudio boleh memasang pustaka audio PortAudio.

2. Proses pelaksanaan

Selepas tetapan persekitaran selesai, langkah seterusnya ialah proses khusus untuk melaksanakan fungsi sembang suara. Pertama, anda perlu mencipta klien dan pelayan supaya pengguna boleh berkomunikasi antara satu sama lain. Selepas sambungan diwujudkan, pelanggan akan dapat menghantar data audio ke pelayan, yang akan menerimanya dan memajukannya kepada pelanggan lain. Kemudian, pelanggan lain boleh menerima data audio daripada pelanggan dan memainkannya.

  1. Buat Pelayan

Langkah pertama untuk mencipta pelayan ialah memulakan perkhidmatan HTTP dan membuat sambungan WebSocket, kodnya adalah seperti berikut:

func main() {

    // 1. 启动HTTP服务
    http.HandleFunc("/", handleWebsocket)
    go http.ListenAndServe(":8080", nil)
    
}

func handleWebsocket(w http.ResponseWriter, r *http.Request) {

    // 2. 创建WebSocket连接
    ws, err := websocket.Upgrade(w, r, nil, 1024, 1024)
    if err != nil {
        log.Fatal(err)
    }
    
    // 3. 处理音频数据传输
    for {
        msgType, msg, err := ws.ReadMessage()
        if err != nil {
            log.Fatal(err)
        }
        ws.WriteMessage(msgType, msg)
    }
    
}
Salin selepas log masuk

dalam kod di atas, perkhidmatan HTTP mula-mula dimulakan dan didengari pada port 8080. Seterusnya, sambungan WebSocket dibuat dalam fungsi handleWebsocket, yang akan dipanggil setiap kali permintaan dihantar ke pelayan. Akhir sekali, untuk mengendalikan penghantaran data audio, beberapa operasi baca dan tulis WebSocket mudah digunakan.

  1. Buat klien

Langkah pertama untuk mencipta klien adalah dengan menyertai pelayan, kodnya adalah seperti berikut:

func main() {

    // ...启动HTTP服务

    // 1. 创建WebSocket连接
    conn, _, err := websocket.DefaultDialer.Dial("ws://localhost:8080", nil)
    if err != nil {
        log.Fatal(err)
    }

    // 2. 加入服务器
    message := []byte("join")
    conn.WriteMessage(websocket.TextMessage, message)

    // 3. 处理音频数据传输
    for {
        _, message, err := conn.ReadMessage()
        if err != nil {
            log.Fatal(err)
        }
        // 处理接收到的音频数据
        // ...
    }

}
Salin selepas log masuk

Dalam kod di atas , mula-mula buat sambungan WebSocket menggunakan fungsi DefaultDialer.Dial dan pautkannya ke pelayan. Seterusnya, pelanggan menggunakan mesej sertai mudah untuk memberitahu pelayan bahawa pelanggan telah menyertai bilik sembang. Akhirnya, pelanggan akan gelung untuk membaca data audio yang dihantar oleh pelayan dan memproses data.

  1. Rakam dan mainkan audio

Langkah seterusnya ialah langkah paling kritikal, rakam dan mainkan audio. Golang menggunakan perpustakaan audio bip untuk pemprosesan audio, yang menyediakan sejumlah besar pemproses audio dan kesan. Berikut ialah contoh kod cara merakam audio menggunakan pustaka:

func main() {

    // ...创建WebSocket连接并加入服务器

    // 1. 配置recorder
    format := beep.Format{
        SampleRate:  44100, //采样率
        NumChannels: 1,     //通道数
        Precision:   2,     //数据精度
    }
    speaker.Init(format.SampleRate, format.SampleRate.N(time.Second/10))

    streamer := &audioStreamer{}
    streamer.buf = new(bytes.Buffer)
    streamer.stream = beep.NewMixedStreamer(beep.StreamerFunc(streamer.Sample), beep.Callback(func() {}))

    resampler, err := resample.New(resample.SincMediumQuality, streamer.stream, streamer)

    // 2. 创建recorder
    stream, format, err := portaudio.OpenDefaultStream(1, 0, format.SampleRate, 0, resampler.Process)

    if err != nil {
        log.Fatal(err)
    }

    // 3. 启动recorder
    err = stream.Start()
    if err != nil {
        log.Fatal(err)
    }

    // 4. 启动播放器
    speaker.Play(beep.Seq(streamer, beep.Callback(func() {})))

    // 5. 处理音频数据传输
    for {
        _, message, err := conn.ReadMessage()
        if err != nil {
            log.Fatal(err)
        }
        // 处理接收到的音频数据
        // ...
    }

}

type audioStreamer struct {
    buf    *bytes.Buffer
    stream beep.Streamer
}

func (a *audioStreamer) Stream(samples [][2]float64) (n int, ok bool) {
    d := make([]byte, len(samples)*4)
    if a.buf.Len() >= len(d) {
        a.buf.Read(d)
        ok = true
    }

    for i, s := range samples {
        s[0] = float64(int16(binary.LittleEndian.Uint16(d[i*4 : i*4+2]))) / 0x8000
    }
    n = len(samples)
    return
}

func (a *audioStreamer) Err() error {
    return nil
}

func (a *audioStreamer) Sample(samples [][2]float64) (n int, ok bool) {
    n, ok = a.stream.Stream(samples)
    a.buf.Write(make([]byte, n*4))
    for i, s := range samples[:n] {
        x := int16(s[0] * 0x8000)
        binary.LittleEndian.PutUint16(a.buf.Bytes()[i*4:i*4+2], uint16(x))
    }
    return
}
Salin selepas log masuk

Dalam kod di atas, strim audio bip pertama kali dibuat dan strim input audio dibuat menggunakan perpustakaan portaudio, yang akan bermula dari lalai Dapatkan input audio daripada peranti input audio. Seterusnya, gunakan perpustakaan sampel semula untuk sampel semula data audio yang diperoleh daripada aliran input untuk menyesuaikan diri dengan kadar sampel audio yang digunakan semasa main semula. Akhir sekali, gunakan pustaka pembesar suara untuk memulakan pemain, yang akan menimbal dan memainkan data audio. Baca data audio dalam gelung dan tuliskannya ke strim audio menggunakan fungsi Sampel.

  1. Hantar data audio ke pelayan

Seterusnya, anda akan menggunakan fungsi WriteMessage untuk menghantar data audio yang dirakam ke pelayan, dan membahagikan data kepada beberapa bahagian , setiap bahagian Dihantar kepada pelanggan lain masing-masing.

func main() {

    // ...录制音频并加入服务器

    // 1. 将音频数据分包(长度为4096)
    packSize := 4096
    maxPackCount := len(buf) / packSize
    for i := 0; i < maxPackCount+1; i++ {
        n := i * packSize
        l := min(len(buf)-n, packSize)
        if l > 0 {
            bufToWrite := buf[n : n+l]
            conn.WriteMessage(websocket.BinaryMessage, bufToWrite)
        }
    }

}

func min(a, b int) int {
    if a < b {
        return a
    }
    return b
}
Salin selepas log masuk

Dalam kod di atas, data audio dalam pembolehubah buf mula-mula dibahagikan kepada beberapa bahagian, setiap bahagian mempunyai panjang 4096. Kemudian, setiap bahagian data audio dihantar kepada pelanggan lain secara berasingan.

Pada ketika ini, program sembang suara mudah telah selesai. Walau bagaimanapun, jika anda ingin menjadikan program ini lebih lengkap dan stabil, penyahpepijatan dan ujian yang lebih terperinci diperlukan. Walau bagaimanapun, menggunakan golang untuk melaksanakan fungsi sembang suara adalah projek pembelajaran yang menarik dan patut dicuba, dan sampel kod di atas boleh memberikan beberapa rujukan asas untuk pemula.

Atas ialah kandungan terperinci Golang melaksanakan sembang suara. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

sumber:php.cn
Kenyataan Laman Web ini
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn
Tutorial Popular
Lagi>
Muat turun terkini
Lagi>
kesan web
Kod sumber laman web
Bahan laman web
Templat hujung hadapan
Tentang kita Penafian Sitemap
Laman web PHP Cina:Latihan PHP dalam talian kebajikan awam,Bantu pelajar PHP berkembang dengan cepat!