Heim Backend-Entwicklung Golang Wie verwende ich die Go-Sprache für die Audio- und Videoverarbeitung?

Wie verwende ich die Go-Sprache für die Audio- und Videoverarbeitung?

Jun 10, 2023 pm 12:07 PM
go语言 音频处理 视频处理

In den letzten Jahren ist mit der Entwicklung der Audio- und Videotechnologie die Nachfrage nach Technologien für die Audio- und Videoverarbeitung immer höher geworden. Als leistungsstarke Programmiersprache bietet Go außerdem viele praktische Tools und Bibliotheken, die uns die Verarbeitung von Audio- und Videodaten erleichtern. In diesem Artikel wird erläutert, wie Sie die Go-Sprache für die Audio- und Videoverarbeitung verwenden. Der spezifische Inhalt lautet wie folgt:

1 So verwenden Sie Go zur Verarbeitung von Audio: In der Go-Sprache erfordert die Verarbeitung von Audiodaten normalerweise die Verwendung eines Audio-Codec-Bibliothek. Zu den derzeit am häufigsten verwendeten gehören portaudio und ffmpeg. Hier nehmen wir ffmpeg als Beispiel und geben einen einfachen Beispielcode zum Lesen von Audiodateien, Konvertieren von Formaten und Speichern:

package main

import (
    "github.com/giorgisio/goav/avcodec"
    "github.com/giorgisio/goav/avformat"
    "github.com/giorgisio/goav/avutil"
    "log"
)

func main() {
    // 打开输入文件
    inputCtx := avformat.AvformatAllocContext()
    if err := avformat.AvformatOpenInput(&inputCtx, "input.mp3", nil, nil); err != nil {
        log.Fatal(err)
    }
    defer avformat.AvformatCloseInput(inputCtx)

    // 查找音频流
    if err := avformat.AvformatFindStreamInfo(inputCtx, nil); err != nil {
        log.Fatal(err)
    }
    audioIndex := -1
    for i := 0; i < int(inputCtx.NbStreams()); i++ {
        codecCtx := inputCtx.Streams()[i].Codec()
        if codecCtx.CodecType() == avutil.AVMEDIA_TYPE_AUDIO {
            audioIndex = i
            break
        }
    }
    if audioIndex < 0 {
        log.Fatal("No audio stream found")
    }

    // 打开解码器
    codecCtx := inputCtx.Streams()[audioIndex].Codec()
    codec := avcodec.AvcodecFindDecoder(codecCtx.CodecId())
    if codec == nil {
        log.Fatal("Unsupported codec")
    }
    if err := codecCtx.AvcodecOpen2(codec, nil); err != nil {
        log.Fatal(err)
    }
    defer codecCtx.AvcodecClose()

    // 打开输出文件
    outputFmt := avformat.AvGuessFormat("wav", "output.wav", "")
    if outputFmt == nil {
        log.Fatal("Failed to guess output format")
    }
    outputCtx := avformat.AvformatAllocContext()
    outputCtx.SetOutputFormat(outputFmt)
    if err := avformat.AvioOpen(outputCtx.Pb(), "output.wav", avformat.AVIO_FLAG_WRITE); err != nil {
        log.Fatal(err)
    }

    // 写入输出头
    if err := avformat.AvformatWriteHeader(outputCtx, nil); err != nil {
        log.Fatal(err)
    }

    // 读取、解码和转换音频帧
    for {
        pkt := avcodec.AvPacketAlloc()
        defer avutil.AvPacketFree(pkt)
        if ret := avformat.AvReadFrame(inputCtx, pkt); ret < 0 {
            if ret == avutil.AVERROR_EOF || ret == avutil.ErrEAGAIN {
                break
            }
            log.Fatal(ret)
        }
        if pkt.StreamIndex() != audioIndex {
            continue
        }
        frame := avutil.AvFrameAlloc()
        defer avutil.AvFrameFree(frame)
        if _, gotframe, ret := codecCtx.AvcodecDecodeAudio4(pkt, frame); ret >= 0 && gotframe {
            // 转换格式
            if _, _, ret := codecCtx.AvcodecSendPacket(pkt); ret < 0 {
                log.Fatal(ret)
            }
            for {
                frame2 := avutil.AvFrameAlloc()
                if _, ret := codecCtx.AvcodecReceiveFrame(frame2); ret == avutil.AvErrorEOF {
                    break
                } else if ret < 0 {
                    log.Fatal(ret)
                }
                if _, ret := avcodec.AvAudioResample(frame2, frame, avformat.AV_SAMPLE_FMT_S16, int(codecCtx.SampleRate()), avformat.AV_SAMPLE_FMT_FLTP, int(codecCtx.SampleRate()), 0, 0); ret < 0 {
                    log.Fatal(ret)
                }

                // 写入输出帧
                if _, ret := avformat.AvInterleavedWriteFrame(outputCtx, frame); ret != nil {
                    log.Fatal(ret)
                }
            }
        }
    }

    // 写入输出尾
    if err := avformat.AvWriteTrailer(outputCtx); err != nil {
        log.Fatal(err)
    }
}
Nach dem Login kopieren

Code-Erklärung:

Eingabedateien lesen
  1. Verwenden Sie avformat.AvformatOpenInput hier Der </code > Funktion öffnet die Eingabedatei und findet den Audiostream mit <code>avformat.AvformatFindStreamInfo.

    Öffnen Sie den Decoderavformat.AvformatOpenInput 函数打开输入文件,并使用 avformat.AvformatFindStreamInfo 查找音频流。

    1. 打开解码器

    在代码中使用 avcodec.AvcodecFindDecoder 函数来查找支持的解码器并打开它,这里假设输入文件的编码格式合法。

    1. 打开输出文件

    使用 avformat.AvGuessFormat 找出输出文件的编码格式,然后使用 avformat.AvformatAllocContext 函数创建输出文件上下文并打开文件。

    1. 读取、解码和转换音频帧

    使用 avformat.AvReadFrame 函数从输入文件中读取帧,并检查它是否属于音频流。如果是,则使用解码器将帧解码为音频数据。然后再使用 avcodec.AvAudioResample 函数将音频数据转换为设定的采样率和格式。最后,使用 avformat.AvInterleavedWriteFrame 函数将输出帧写入输出文件。

    1. 最后,关闭输入和输出文件。

    二、如何使用 Go 处理视频

    在 Go 语言中处理视频数据同样需要使用视频编解码库,同样可以使用 ffmpeg 这个工具库。接下来给出一个简单的读取视频文件、提取帧和保存的示例代码:

    package main
    
    import (
        "github.com/giorgisio/goav/avcodec"
        "github.com/giorgisio/goav/avformat"
        "github.com/giorgisio/goav/avutil"
        "image"
        "os"
    )
    
    func main() {
        // 打开输入文件
        inputCtx := avformat.AvformatAllocContext()
        if err := avformat.AvformatOpenInput(&inputCtx, "input.mp4", nil, nil); err != nil {
            panic(err)
        }
        defer avformat.AvformatCloseInput(inputCtx)
    
        // 查找视频流
        if err := avformat.AvformatFindStreamInfo(inputCtx, nil); err != nil {
            panic(err)
        }
        videoIndex := -1
        for i := 0; i < int(inputCtx.NbStreams()); i++ {
            codecCtx := inputCtx.Streams()[i].Codec()
            if codecCtx.CodecType() == avutil.AVMEDIA_TYPE_VIDEO {
                videoIndex = i
                break
            }
        }
        if videoIndex < 0 {
            panic("No video stream found")
        }
    
        // 打开解码器
        codecCtx := inputCtx.Streams()[videoIndex].Codec()
        codec := avcodec.AvcodecFindDecoder(codecCtx.CodecId())
        if codec == nil {
            panic("Unsupported codec")
        }
        if err := codecCtx.AvcodecOpen2(codec, nil); err != nil {
            panic(err)
        }
        defer codecCtx.AvcodecClose()
    
        // 创建输出文件
        output, err := os.Create("output.jpg")
        if err != nil {
            panic(err)
        }
        defer output.Close()
    
        // 提取视频帧
        packet := avutil.AvPacketAlloc()
        defer avutil.AvPacketFree(packet)
        for {
            if ret := avformat.AvReadFrame(inputCtx, packet); ret < 0 {
                if ret == avutil.AVERROR_EOF || ret == avutil.ErrEAGAIN {
                    break
                }
                panic(ret)
            }
            if packet.StreamIndex() != videoIndex {
                continue
            }
    
            // 解码视频帧
            frame := avutil.AvFrameAlloc()
            defer avutil.AvFrameFree(frame)
            if gotframe, ret := codecCtx.AvcodecSendPacket(packet); ret >= 0 && gotframe {
                for {
                    frame := avutil.AvFrameAlloc()
                    if _, ret := codecCtx.AvcodecReceiveFrame(frame); ret == avutil.AvErrorEOF {
                        break
                    } else if ret < 0 {
                        panic(ret)
                    }
    
                    // 写入输出文件
                    img := image.NewRGBA(image.Rect(0, 0, int(frame.Width()), int(frame.Height())))
                    for y := 0; y < int(frame.Height()); y++ {
                        for x := 0; x < int(frame.Width()); x++ {
                            c := frame.Data(0)[y*frame.Linesize(0)+x*3 : y*frame.Linesize(0)+x*3+3]
                            img.SetRGBA(x, y, color.RGBA{c[0], c[1], c[2], 255})
                        }
                    }
                    if err := jpeg.Encode(output, img, &jpeg.Options{Quality: 100}); err != nil {
                        panic(err)
                    }
                    break
                }
            }
        }
    }
    Nach dem Login kopieren

    代码解释:

    1. 读取输入文件

    同样是使用 avformat.AvformatOpenInput 函数打开输入文件,并使用 avformat.AvformatFindStreamInfo 查找视频流。

    1. 打开解码器

    在代码中同样使用 avcodec.AvcodecFindDecoder 函数来查找支持的解码器并打开它,这里假设输入文件的编码格式合法。

    1. 创建输出文件

    使用 Go 内置的 os 包创建输出文件并打开。

    1. 提取视频帧

    使用 avformat.AvReadFrame

      Verwenden Sie die Funktion avcodec.AvcodecFindDecoder im Code, um den unterstützten Decoder zu finden und ihn zu öffnen. Es wird davon ausgegangen, dass das Codierungsformat des Die Eingabedatei ist legal.
      1. Öffnen Sie die Ausgabedatei

      Verwenden Sie avformat.AvGuessFormat, um das Codierungsformat der Ausgabedatei herauszufinden, und verwenden Sie dann avformat.AvformatAllocContext code>-Funktion zum Erstellen des Ausgabedateikontexts und zum Öffnen der Datei. <p></p> <ol start="4">Audioframes lesen, dekodieren und konvertieren 🎜🎜🎜Verwenden Sie die Funktion <code>avformat.AvReadFrame, um einen Frame aus der Eingabedatei zu lesen und zu prüfen, ob er zum Audiostream gehört . Wenn ja, verwenden Sie einen Decoder, um den Frame in Audiodaten zu dekodieren. Verwenden Sie dann die Funktion avcodec.AvAudioResample, um die Audiodaten in die eingestellte Abtastrate und das eingestellte Format zu konvertieren. Verwenden Sie abschließend die Funktion avformat.AvInterleavedWriteFrame, um den Ausgaberahmen in die Ausgabedatei zu schreiben. 🎜🎜🎜Schließen Sie abschließend die Eingabe- und Ausgabedateien. 🎜🎜🎜2. So verwenden Sie Go zum Verarbeiten von Videos🎜🎜Die Verarbeitung von Videodaten in der Go-Sprache erfordert auch die Verwendung einer Video-Codec-Bibliothek, und Sie können auch die ffmpeg-Tool-Bibliothek verwenden. Als nächstes wird ein einfacher Beispielcode zum Lesen einer Videodatei, Extrahieren von Bildern und Speichern gegeben: 🎜rrreee🎜Codeerklärung: 🎜🎜🎜Eingabedatei lesen🎜🎜🎜auch mit der Funktion avformat.AvformatOpenInput Öffnen die Eingabedatei und verwenden Sie avformat.AvformatFindStreamInfo, um den Videostream zu finden. 🎜
        🎜Öffnen Sie den Decoder🎜🎜🎜Verwenden Sie auch die Funktion avcodec.AvcodecFindDecoder im Code, um den unterstützten Decoder zu finden und ihn zu öffnen. Es wird davon ausgegangen, dass das Codierungsformat von Die Eingabedatei ist legal. 🎜
          🎜Ausgabedatei erstellen🎜🎜🎜Verwenden Sie das integrierte Betriebssystempaket von Go, um eine Ausgabedatei zu erstellen und diese zu öffnen. 🎜
            🎜Videobilder extrahieren🎜🎜🎜Verwenden Sie die Funktion avformat.AvReadFrame, um das Bild aus der Eingabedatei zu lesen und zu prüfen, ob es zum Videostream gehört. Wenn ja, verwenden Sie einen Decoder, um das Bild in Videodaten zu dekodieren. Anschließend werden die Videodaten über eine Schleife in Bilddaten (hier im JPEG-Format) umgewandelt und in die Ausgabedatei geschrieben. 🎜🎜🎜Schließen Sie abschließend die Eingabe- und Ausgabedateien. 🎜🎜🎜Zusammenfassung🎜🎜In diesem Artikel wird erläutert, wie Sie die Go-Sprache zum Verarbeiten von Audio- und Videodaten verwenden. Formatanalyse sowie Kodierung und Dekodierung sind wichtige Verknüpfungen bei der Audio- und Videoverarbeitung. Hier verwenden wir die ffmpeg-Toolbibliothek zur Verarbeitung von Audio- und Videoformaten. In tatsächlichen Anwendungen sind möglicherweise komplexere Audio- und Videoverarbeitungsvorgänge erforderlich, das gesamte Code-Framework ist jedoch ähnlich. Wir hoffen, dass unser Beispielcode Ihnen bei der Audio- und Videoverarbeitung helfen kann. 🎜

    Das obige ist der detaillierte Inhalt vonWie verwende ich die Go-Sprache für die Audio- und Videoverarbeitung?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

    Erklärung dieser Website
    Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn

    Heiße KI -Werkzeuge

    Undresser.AI Undress

    Undresser.AI Undress

    KI-gestützte App zum Erstellen realistischer Aktfotos

    AI Clothes Remover

    AI Clothes Remover

    Online-KI-Tool zum Entfernen von Kleidung aus Fotos.

    Undress AI Tool

    Undress AI Tool

    Ausziehbilder kostenlos

    Clothoff.io

    Clothoff.io

    KI-Kleiderentferner

    AI Hentai Generator

    AI Hentai Generator

    Erstellen Sie kostenlos Ai Hentai.

    Heißer Artikel

    R.E.P.O. Energiekristalle erklärten und was sie tun (gelber Kristall)
    4 Wochen vor By 尊渡假赌尊渡假赌尊渡假赌
    R.E.P.O. Beste grafische Einstellungen
    4 Wochen vor By 尊渡假赌尊渡假赌尊渡假赌
    R.E.P.O. So reparieren Sie Audio, wenn Sie niemanden hören können
    4 Wochen vor By 尊渡假赌尊渡假赌尊渡假赌
    WWE 2K25: Wie man alles in Myrise freischaltet
    1 Monate vor By 尊渡假赌尊渡假赌尊渡假赌

    Heiße Werkzeuge

    Notepad++7.3.1

    Notepad++7.3.1

    Einfach zu bedienender und kostenloser Code-Editor

    SublimeText3 chinesische Version

    SublimeText3 chinesische Version

    Chinesische Version, sehr einfach zu bedienen

    Senden Sie Studio 13.0.1

    Senden Sie Studio 13.0.1

    Leistungsstarke integrierte PHP-Entwicklungsumgebung

    Dreamweaver CS6

    Dreamweaver CS6

    Visuelle Webentwicklungstools

    SublimeText3 Mac-Version

    SublimeText3 Mac-Version

    Codebearbeitungssoftware auf Gottesniveau (SublimeText3)

    Welche Bibliotheken werden für die Operationen der schwimmenden Punktzahl in Go verwendet? Welche Bibliotheken werden für die Operationen der schwimmenden Punktzahl in Go verwendet? Apr 02, 2025 pm 02:06 PM

    In der Bibliothek, die für den Betrieb der Schwimmpunktnummer in der GO-Sprache verwendet wird, wird die Genauigkeit sichergestellt, wie die Genauigkeit ...

    Was ist das Problem mit Warteschlangen -Thread in Go's Crawler Colly? Was ist das Problem mit Warteschlangen -Thread in Go's Crawler Colly? Apr 02, 2025 pm 02:09 PM

    Das Problem der Warteschlange Threading In Go Crawler Colly untersucht das Problem der Verwendung der Colly Crawler Library in Go -Sprache. Entwickler stoßen häufig auf Probleme mit Threads und Anfordern von Warteschlangen. � ...

    Warum hat das Drucken von Saiten mit Println und String () -Funktionen unterschiedliche Effekte? Warum hat das Drucken von Saiten mit Println und String () -Funktionen unterschiedliche Effekte? Apr 02, 2025 pm 02:03 PM

    Der Unterschied zwischen Stringdruck in GO -Sprache: Der Unterschied in der Wirkung der Verwendung von Println und String () ist in Go ...

    Welche Bibliotheken in GO werden von großen Unternehmen entwickelt oder von bekannten Open-Source-Projekten bereitgestellt? Welche Bibliotheken in GO werden von großen Unternehmen entwickelt oder von bekannten Open-Source-Projekten bereitgestellt? Apr 02, 2025 pm 04:12 PM

    Welche Bibliotheken in GO werden von großen Unternehmen oder bekannten Open-Source-Projekten entwickelt? Bei der Programmierung in Go begegnen Entwickler häufig auf einige häufige Bedürfnisse, ...

    Wie löste ich das Problem des Typs des user_id -Typs bei der Verwendung von Redis -Stream, um Nachrichtenwarteschlangen in GO -Sprache zu implementieren? Wie löste ich das Problem des Typs des user_id -Typs bei der Verwendung von Redis -Stream, um Nachrichtenwarteschlangen in GO -Sprache zu implementieren? Apr 02, 2025 pm 04:54 PM

    Das Problem der Verwendung von RETISTREAM zur Implementierung von Nachrichtenwarteschlangen in der GO -Sprache besteht darin, die Go -Sprache und Redis zu verwenden ...

    Was soll ich tun, wenn die benutzerdefinierten Strukturbezeichnungen in Goland nicht angezeigt werden? Was soll ich tun, wenn die benutzerdefinierten Strukturbezeichnungen in Goland nicht angezeigt werden? Apr 02, 2025 pm 05:09 PM

    Was soll ich tun, wenn die benutzerdefinierten Strukturbezeichnungen in Goland nicht angezeigt werden? Bei der Verwendung von Goland für GO -Sprachentwicklung begegnen viele Entwickler benutzerdefinierte Struktur -Tags ...

    Was ist der Unterschied zwischen 'var' und 'Typ' Typenwort Definition in der GO -Sprache? Was ist der Unterschied zwischen 'var' und 'Typ' Typenwort Definition in der GO -Sprache? Apr 02, 2025 pm 12:57 PM

    Zwei Möglichkeiten, Strukturen in der GO -Sprache zu definieren: Der Unterschied zwischen VAR- und Typ -Schlüsselwörtern. Bei der Definition von Strukturen sieht die Sprache oft zwei verschiedene Schreibweisen: Erstens ...

    Warum ist es notwendig, Zeiger zu verabschieden, wenn sie GO- und Viper -Bibliotheken verwenden? Warum ist es notwendig, Zeiger zu verabschieden, wenn sie GO- und Viper -Bibliotheken verwenden? Apr 02, 2025 pm 04:00 PM

    Go Zeigersyntax und Probleme bei der Verwendung der Viper -Bibliothek bei der Programmierung in Go -Sprache. Es ist entscheidend, die Syntax und Verwendung von Zeigern zu verstehen, insbesondere in ...

    See all articles