현대 미디어에서 비디오가 더욱 광범위하게 사용됨에 따라 많은 애플리케이션에서 다양한 플랫폼과 장치 간의 비디오 트랜스코딩이 필요합니다. 그 과정에서 FFmpeg와 Golang은 많은 개발자가 선택하는 트랜스코딩 도구가 되었습니다. 이 글에서는 FFmpeg와 Golang의 기본 개념과 사용법, 그리고 효율적인 비디오 트랜스코딩을 위해 이들을 결합하는 방법을 소개합니다.
FFmpeg 소개
FFmpeg는 다양한 비디오 형식을 처리하는 데 사용할 수 있는 오픈 소스 크로스 플랫폼 비디오 및 오디오 코덱 라이브러리입니다. 개발자가 형식 변환, 비디오 자르기, 실시간 트랜스코딩 등과 같은 기능을 직접 사용할 수 있는 명령줄 도구를 제공합니다.
Golang 소개
Golang은 Google과 오픈 소스가 처음 개발한 최신 프로그래밍 언어입니다. 효율적이고 간단하며 안전한 프로그래밍 언어로 널리 알려져 있으며 특히 네트워크 및 클라우드 컴퓨팅 애플리케이션에 사용하기에 적합합니다.
FFmpeg와 Golang 결합
Golang은 CGO 기술을 사용하여 C 언어 라이브러리를 호출할 수 있으므로 FFmpeg의 기능을 쉽게 사용할 수 있습니다. FFmpeg의 명령줄 도구를 사용하면 비디오를 mp4, webm 등과 같은 다양한 형식으로 쉽게 트랜스코딩할 수 있습니다.
그러나 FFmpeg 명령줄 도구를 직접 호출하면 하위 프로세스를 포크한 다음 하위 프로세스가 종료될 때까지 기다려야 결과를 얻을 수 있습니다. 이 방법은 비효율적이며 프로그램 확장 및 유지 관리에 도움이 되지 않습니다.
그래서 Golang에서는 Golang 프로그램에서 C 코드를 쉽게 사용할 수 있게 하고, 이어서 FFmpeg의 기능을 편리하게 사용할 수 있도록 cgo라는 도구를 제공합니다. 다음 예에서는 cgo 기술을 통해 FFmpeg의 기능을 캡슐화하는 방법을 보여줍니다.
먼저 FFmpeg에서 AVFrame 유형을 나타내기 위해 Golang에서 구조를 정의해야 합니다.
type AVFrame struct { data [8]*uint8 linesize [8]int32 best_effort_timestamp int64 pkt_pts int64 }
다음으로 FFmpeg 함수를 호출하기 위해 일부 C 함수 인터페이스를 정의해야 합니다. 예를 들어, 오디오 또는 비디오 파일을 여는 함수를 정의할 수 있습니다:
// #cgo LDFLAGS: -lavformat -lavcodec -lavutil // #include <libavformat/avformat.h> // #include <libavcodec/avcodec.h> // #include <libavutil/avutil.h> import "C" func av_open_input_file(pFormatContext **C.AVFormatContext, filename string, fmt *C.AVInputFormat, buf_size int, pFormatParams **C.AVFormatParameters) int { cfilename := C.CString(filename) defer C.free(unsafe.Pointer(cfilename)) result := C.av_open_input_file(pFormatContext, cfilename, fmt, C.int(buf_size), pFormatParams) return int(result) }
위 코드에서 주석 지시문 #cgo LDFLAGS를 사용하여 Golang 컴파일러에 FFmpeg 라이브러리 파일을 연결해야 함을 알립니다. 동시에 CGO에서 제공하는 unsafe.Pointer 유형을 사용하여 포인터 개체를 C 코드에 전달합니다.
물론 FFmpeg에서 제공하는 다른 기능을 사용하기 위해서는 다른 C 기능 인터페이스를 정의해야 합니다. 예제 소개를 단순화하기 위해 여기에는 간단한 인터페이스 기능만 나열됩니다.
이러한 인터페이스 함수를 정의하면 Golang 코드에서 이러한 인터페이스 함수를 쉽게 사용하여 FFmpeg의 다양한 기능을 활용할 수 있습니다.
예를 들어 다음 코드를 사용하여 WAV 형식의 오디오 파일을 mp3 형식으로 변환할 수 있습니다.
func main() { var pFormatContext *C.AVFormatContext var inputFormat *C.AVInputFormat var formatParams *C.AVFormatParameters filename := "input.wav" if ret := av_open_input_file(&pFormatContext, filename, inputFormat, 0, &formatParams); ret != 0 { log.Fatalf("Could not open input file %s, error code=%d ", filename, ret) } if ret := C.avformat_find_stream_info(pFormatContext, nil); ret < 0 { log.Fatalf("Could not find stream info, error code=%d ", ret) } audioStreamIndex := -1 for i := 0; i < int(pFormatContext.nb_streams); i++ { st := (*C.AVStream)(unsafe.Pointer(uintptr(unsafe.Pointer(pFormatContext.streams)) + uintptr(i)*unsafe.Sizeof(*pFormatContext.streams))) if st.codec.codec_type == C.AVMEDIA_TYPE_AUDIO { audioStreamIndex = i break } } if audioStreamIndex == -1 { log.Fatalf("Could not find audio stream ") } audioStream := (*C.AVStream)(unsafe.Pointer(uintptr(unsafe.Pointer(pFormatContext.streams)) + uintptr(audioStreamIndex)*unsafe.Sizeof(*pFormatContext.streams))) audioCodecContext := (*C.AVCodecContext)(unsafe.Pointer(audioStream.codec)) audioCodec := C.avcodec_find_decoder(audioCodecContext.codec_id) if audioCodec == nil { log.Fatalf("Unsupported codec type, codec_id=%d ", audioCodecContext.codec_id) } if ret := C.avcodec_open2(audioCodecContext, audioCodec, nil); ret < 0 { log.Fatalf("Could not open audio codec, error code=%d ", ret) } tempFilePath := "temp.raw" tempFile, _ := os.Create(tempFilePath) defer tempFile.Close() defer os.Remove(tempFilePath) packet := (*C.AVPacket)(C.malloc(C.sizeof_AVPacket)) defer C.free(unsafe.Pointer(packet)) frame := (*C.AVFrame)(C.avcodec_alloc_frame()) defer C.av_free(unsafe.Pointer(frame)) for { if ret := C.av_read_frame(pFormatContext, packet); ret < 0 { break } if packet.stream_index == C.int(audioStreamIndex) { if ret := C.avcodec_decode_audio4(audioCodecContext, frame, (*C.int)(nil), packet); ret > 0 { numSamples := int(frame.nb_samples) dataPtr := uintptr(unsafe.Pointer(frame.data[0])) dataSlice := (*[1 << 30]byte)(unsafe.Pointer(dataPtr)) dataSize := numSamples * int(audioCodecContext.channels) * int(C.av_get_bytes_per_sample(audioCodecContext.sample_fmt)) tempFile.Write(dataSlice[:dataSize]) } } C.av_free_packet(packet) } tempFile.Close() outputFilePath := "output.mp3" cmd := exec.Command("ffmpeg", "-y", "-f", "s16le", "-ar", strconv.Itoa(int(audioCodecContext.sample_rate)), "-ac", strconv.Itoa(int(audioCodecContext.channels)), "-i", tempFilePath, "-f", "mp3", outputFilePath) stdout, _ := cmd.StdoutPipe() cmd.Start() for { buf := make([]byte, 1024) n, err := stdout.Read(buf) if err != nil || n == 0 { break } } cmd.Wait() }
위의 예에서는 먼저 av_open_input_file 함수를 사용하여 오디오 파일을 연 다음 avformat_find_stream_info 함수를 사용하여 오디오 스트림 정보를 가져옵니다.
다음으로 모든 스트림을 반복하여 오디오 스트림을 찾고 avcodec_open2 함수를 사용하여 오디오 디코더를 엽니다. 그런 다음 av_read_frame 함수를 사용하여 오디오 데이터를 프레임별로 읽고 오디오 데이터를 임시 파일에 씁니다.
마지막으로 FFmpeg 명령줄 도구를 사용하여 임시 파일의 오디오 데이터를 mp3 형식의 오디오 파일로 변환합니다.
결론
Golang과 FFmpeg를 결합하면 효율적인 비디오 트랜스코딩 프로그램을 쉽게 구현하고 Golang의 우아한 구문과 내장 기능을 사용할 수 있습니다. cgo 기술을 사용하려면 C 언어에 대한 지식이 어느 정도 필요할 수 있지만 구현이 어렵지 않고 결과도 상당합니다. 비디오 트랜스코딩 프로그램을 개발할 때 고성능과 이식성이 필요하다면 Golang과 FFmpeg를 결합하는 것이 좋은 선택이 될 수 있습니다.
위 내용은 ffmpeg 골랑 트랜스코딩의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!