Comment implémenter le traitement audio pour les applications Web à l'aide de Golang-Golang-php.cn

Maison

développement back-end

Golang

Comment implémenter le traitement audio pour les applications Web à l'aide de Golang

王林

Jun 25, 2023 am 09:50 AM

golang web应用音频处理

Avec le développement d'Internet, le traitement audio est devenu une tâche de plus en plus importante. La mise en œuvre du traitement audio est une compétence nécessaire pour les applications Web. En tant que langage de programmation rapide et efficace, Golang peut également être utilisé pour implémenter le traitement audio pour les applications Web.

Dans cet article, nous présenterons comment utiliser Golang pour implémenter le traitement audio pour les applications Web, y compris le téléchargement de fichiers audio, la conversion de format audio et l'extraction de fonctionnalités audio.

1. Téléchargement de fichiers audio

Avant de mettre en œuvre le traitement audio, vous devez d'abord télécharger des fichiers audio. Le package tiers gin peut être utilisé dans Golang pour réaliser un développement rapide d'applications Web.

Afin d'implémenter le téléchargement de fichiers, vous devez d'abord ajouter des balises d'entrée dans le code HTML pour implémenter la page de téléchargement de fichiers, comme indiqué ci-dessous :

<html>
  <head>
    <title>音频文件上传</title>
  </head>
  <body>
    <form enctype="multipart/form-data" action="/upload" method="post">
      <input type="file" name="file" />
      <input type="submit" value="上传" />
    </form>
  </body>
</html>

Copier après la connexion

Ensuite, vous pouvez utiliser gin dans Golang pour implémenter la fonction de traitement de téléchargement de fichiers, comme indiqué ci-dessous :

func uploadFile(c *gin.Context) {
  file, err := c.FormFile("file")
  if err != nil {
    log.Println(err)
    c.String(http.StatusBadRequest, "Bad request")
    return
  }

  // 保存上传的文件
  err = c.SaveUploadedFile(file, file.Filename)
  if err != nil {
    log.Println(err)
    c.String(http.StatusInternalServerError, "Internal server error")
    return
  }

  c.String(http.StatusOK, fmt.Sprintf("'%s' uploaded!", file.Filename))
}

Copier après la connexion

2. Conversion du format audio

Avant la mise en œuvre du traitement audio, le format du fichier audio téléchargé doit être converti afin qu'il puisse être utilisé par les fonctions de traitement ultérieures. Vous pouvez utiliser le package tiers goav dans Golang pour implémenter la conversion du format audio.

Tout d'abord, vous devez installer FFmpeg pour goav. Dans le système Ubuntu, vous pouvez utiliser la commande suivante pour l'installer :

sudo apt install ffmpeg

Copier après la connexion

Ensuite, vous pouvez utiliser goav pour convertir les formats audio dans Golang, comme la conversion du format MP3 au format WAV. , comme suit :

func convertAudioFormat(inputFile string, outputFile string) error {
  ctx := avutil.AvAllocContext()
  defer avutil.AvFree(ctx)

  // 打开输入音频文件
  if avformat.AvformatOpenInput(&ctx, inputFile, nil, nil) != 0 {
    return errors.New("无法打开输入音频文件")
  }
  defer avformat.AvformatCloseInput(ctx)

  // 检索音频流信息
  if avformat.AvformatFindStreamInfo(ctx, nil) < 0 {
    return errors.New("无法获取音频流信息")
  }

  // 寻找音频流索引
  audioIndex := -1
  for i := 0; i < int(ctx.NbStreams()); i++ {
    if ctx.Streams()[i].CodecParameters().CodecType() == avcodec.AVMEDIA_TYPE_AUDIO {
      audioIndex = i
      break
    }
  }
  if audioIndex < 0 {
    return errors.New("音频流不存在")
  }

  // 打开音频解码器
  codecParams := ctx.Streams()[audioIndex].CodecParameters()
  codec := avcodec.AvcodecFindDecoder(codecParams.CodecId())
  if codec == nil {
    return errors.New("无法打开音频解码器")
  }
  if codec.AvcodecOpen(codecParams) != 0 {
    return errors.New("无法打开音频解码器")
  }
  defer codec.AvcodecClose()

  // 打开输出音频文件
  outctx := avformat.AvformatAllocContext()
  defer avformat.AvformatFreeContext(outctx)
  if avformat.AvformatAllocOutputContext2(&outctx, nil, "wav", outputFile) != 0 {
    return errors.New("无法打开输出音频文件")
  }
  defer func() {
    avio.AvioClose(outctx.Pb())
    avformat.AvformatFreeContext(outctx)
  }()

  // 写入音频流头部信息
  stream := avformat.AvformatNewStream(outctx, nil)
  defer avutil.AvFree(stream.CodecParameters())
  if avcodec.AvCodecParametersCopy(stream.CodecParameters(), codecParams) != 0 {
    return errors.New("无法复制音频参数")
  }

  // 写入文件头部信息
  if outctx.Format().Flags()&avformat.AVFMT_NOFILE == 0 {
    if avio.AvioOpen(&outctx.Pb(), outputFile, avutil.AVIO_FLAG_WRITE) < 0 {
      return errors.New("无法打开输出文件")
    }
  }
  if avformat.AvformatWriteHeader(outctx, nil) < 0 {
    return errors.New("无法写入文件头部信息")
  }

  // 转换音频格式并写入文件
  packet := avcodec.AvPacketAlloc()
  defer avcodec.AvPacketUnref(packet)
  for {
    frame, err := codec.AvcodecReceiveFrame(packet)
    if err != nil {
      if err == avutil.ErrEOF || err == avutil.ErrEAGAIN {
        break
      } else {
        return errors.New("无法接收音频帧")
      }
    }
    if frame.Pts() != avutil.AvNoPts && codec.Avctx().TimeBase().Den() > 0 {
      frame.SetPts(avutil.AvRescaleQ(frame.Pts(), codec.Avctx().TimeBase(), stream.TimeBase()))
    }
    if frame.PktDts() != avutil.AvNoPts && codec.Avctx().TimeBase().Den() > 0 {
      frame.SetPktDts(avutil.AvRescaleQ(frame.PktDts(), codec.Avctx().TimeBase(), stream.TimeBase()))
    }
    if frame.PktPts() != avutil.AvNoPts && codec.Avctx().TimeBase().Den() > 0 {
      frame.SetPktPts(avutil.AvRescaleQ(frame.PktPts(), codec.Avctx().TimeBase(), stream.TimeBase()))
    }
    if avcodec.AvCodecSendFrame(codec, frame) != 0 {
      return errors.New("无法发送音频帧")
    }
    for {
      err := avcodec.AvCodecReceivePacket(codec, packet)
      if err != nil {
        if err == avutil.ErrEOF || err == avutil.ErrEAGAIN {
          break
        } else {
          return errors.New("无法接收音频数据包")
        }
      }
      packet.SetStreamIndex(stream.Index())
      if avformat.AvInterleavedWriteFrame(outctx, packet) < 0 {
        return errors.New("无法写入音频数据包")
      }
      avcodec.AvPacketUnref(packet)
    }
    avutil.AvFrameFree(&frame)
  }

  // 写入文件尾部信息
  if avformat.AvWriteTrailer(outctx) < 0 {
    return errors.New("无法写入文件尾部信息")
  }

  return nil
}

Copier après la connexion

3. Extraction de fonctionnalités audio

Enfin, nous devons implémenter certains algorithmes d'extraction de fonctionnalités audio afin de traiter les fichiers audio.

Par exemple, vous pouvez utiliser le package go-dsp pour implémenter la transformation de Fourier à court terme (STFT) afin de convertir des fichiers audio en spectrogrammes. Comme indiqué ci-dessous :

func stft(signal []float64, windowSize int, overlap float64) [][]complex128 {
  hopSize := int(float64(windowSize) * (1.0 - overlap))
  fftSize := windowSize / 2

  stftMatrix := make([][]complex128, 0)

  for i := 0; i+windowSize < len(signal); i += hopSize {
    segment := signal[i : i+windowSize]
    window := dsp.NewWindow(windowSize, dsp.Hamming)

    fftIn := make([]complex128, windowSize)
    for j := range segment {
      fftIn[j] = complex(segment[j], 0)
    }
    window.Apply(fftIn)
    fftOut := make([]complex128, fftSize)
    for j := range fftOut {
      fftOut[j] = 0
    }
    fft.FFT(fftOut, fftIn)

    stftRow := make([]complex128, fftSize)
    for j := range stftRow {
      stftRow[j] = fftOut[j]
    }
    stftMatrix = append(stftMatrix, stftRow)
  }

  return stftMatrix
}

Copier après la connexion

De plus, vous pouvez également utiliser le package go-dsp pour implémenter d'autres algorithmes d'extraction de fonctionnalités audio, tels que MFCC (Mel Cepstral Coefficient) ou ZCR (Zero Crossing Rate), etc.

En résumé, cet article explique comment utiliser Golang pour implémenter le traitement audio pour les applications Web, y compris le téléchargement de fichiers audio, la conversion de format audio et l'extraction de fonctionnalités audio. Ces compétences peuvent aider les développeurs développant des applications Web à mieux traiter les données audio et à offrir aux utilisateurs une meilleure expérience utilisateur.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration de ce site Web

Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn

Outils d'IA chauds

Undresser.AI Undress

Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover

Outil d'IA en ligne pour supprimer les vêtements des photos.

Undress AI Tool

Images de déshabillage gratuites

Clothoff.io

Dissolvant de vêtements AI

AI Hentai Generator

Générez AI Hentai gratuitement.

Afficher plus

Article chaud

R.E.P.O. Crystals d'énergie expliqués et ce qu'ils font (cristal jaune)

3 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌

R.E.P.O. Meilleurs paramètres graphiques

3 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌

Assassin's Creed Shadows: Solution d'énigmes de coquille

2 Il y a quelques semaines By DDD

R.E.P.O. Comment réparer l'audio si vous n'entendez personne

3 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌

WWE 2K25: Comment déverrouiller tout dans Myrise

3 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌

Afficher plus

Outils chauds

Bloc-notes++7.3.1

Éditeur de code facile à utiliser et gratuit

SublimeText3 version chinoise

Version chinoise, très simple à utiliser

Envoyer Studio 13.0.1

Puissant environnement de développement intégré PHP

Dreamweaver CS6

Outils de développement Web visuel

SublimeText3 version Mac

Logiciel d'édition de code au niveau de Dieu (SublimeText3)

Afficher plus

Sujets chauds

Où se trouve l'entrée de connexion pour la messagerie Gmail ?

7461

Tutoriel CakePHP

1376

Quel est le format du nom de compte de Steam

Clé d&amp;amp;amp;amp;amp;amp;#39;activation Win11 permanent

NYT Connexions Indices et réponses

Afficher plus

Related knowledge

Comment lire et écrire des fichiers en toute sécurité avec Golang ? Jun 06, 2024 pm 05:14 PM

Lire et écrire des fichiers en toute sécurité dans Go est crucial. Les directives incluent : Vérification des autorisations de fichiers Fermeture de fichiers à l'aide de reports Validation des chemins de fichiers Utilisation de délais d'attente contextuels Le respect de ces directives garantit la sécurité de vos données et la robustesse de vos applications.

Comment configurer le pool de connexions pour la connexion à la base de données Golang ? Jun 06, 2024 am 11:21 AM

Comment configurer le pool de connexions pour les connexions à la base de données Go ? Utilisez le type DB dans le package base de données/sql pour créer une connexion à la base de données ; définissez MaxOpenConns pour contrôler le nombre maximum de connexions simultanées ; définissez MaxIdleConns pour définir le nombre maximum de connexions inactives ; définissez ConnMaxLifetime pour contrôler le cycle de vie maximum de la connexion ;

Comparaison des avantages et des inconvénients du framework Golang Jun 05, 2024 pm 09:32 PM

Le framework Go se distingue par ses hautes performances et ses avantages en matière de concurrence, mais il présente également certains inconvénients, tels qu'être relativement nouveau, avoir un petit écosystème de développeurs et manquer de certaines fonctionnalités. De plus, les changements rapides et les courbes d’apprentissage peuvent varier d’un cadre à l’autre. Le framework Gin est un choix populaire pour créer des API RESTful en raison de son routage efficace, de sa prise en charge JSON intégrée et de sa puissante gestion des erreurs.

Quelles sont les meilleures pratiques pour la gestion des erreurs dans le framework Golang ? Jun 05, 2024 pm 10:39 PM

Meilleures pratiques : créer des erreurs personnalisées à l'aide de types d'erreurs bien définis (package d'erreurs) fournir plus de détails consigner les erreurs de manière appropriée propager correctement les erreurs et éviter de masquer ou de supprimer les erreurs Wrap si nécessaire pour ajouter du contexte

Comment enregistrer les données JSON dans la base de données dans Golang ? Jun 06, 2024 am 11:24 AM

Les données JSON peuvent être enregistrées dans une base de données MySQL à l'aide de la bibliothèque gjson ou de la fonction json.Unmarshal. La bibliothèque gjson fournit des méthodes pratiques pour analyser les champs JSON, et la fonction json.Unmarshal nécessite un pointeur de type cible pour désorganiser les données JSON. Les deux méthodes nécessitent la préparation d'instructions SQL et l'exécution d'opérations d'insertion pour conserver les données dans la base de données.

Golang Framework vs Go Framework : comparaison de l'architecture interne et des fonctionnalités externes Jun 06, 2024 pm 12:37 PM

La différence entre le framework GoLang et le framework Go se reflète dans l'architecture interne et les fonctionnalités externes. Le framework GoLang est basé sur la bibliothèque standard Go et étend ses fonctionnalités, tandis que le framework Go se compose de bibliothèques indépendantes pour atteindre des objectifs spécifiques. Le framework GoLang est plus flexible et le framework Go est plus facile à utiliser. Le framework GoLang présente un léger avantage en termes de performances et le framework Go est plus évolutif. Cas : gin-gonic (framework Go) est utilisé pour créer l'API REST, tandis qu'Echo (framework GoLang) est utilisé pour créer des applications Web.

Comment résoudre les problèmes de sécurité courants dans le framework Golang ? Jun 05, 2024 pm 10:38 PM

Comment résoudre les problèmes de sécurité courants dans le framework Go Avec l'adoption généralisée du framework Go dans le développement Web, il est crucial d'assurer sa sécurité. Ce qui suit est un guide pratique pour résoudre les problèmes de sécurité courants, avec un exemple de code : 1. Injection SQL Utilisez des instructions préparées ou des requêtes paramétrées pour empêcher les attaques par injection SQL. Par exemple : constquery="SELECT*FROMusersWHEREusername=?"stmt,err:=db.Prepare(query)iferr!=nil{//Handleerror}err=stmt.QueryR

Comment trouver la première sous-chaîne correspondant à une expression régulière Golang ? Jun 06, 2024 am 10:51 AM

La fonction FindStringSubmatch recherche la première sous-chaîne correspondant à une expression régulière : la fonction renvoie une tranche contenant la sous-chaîne correspondante, le premier élément étant la chaîne entière correspondante et les éléments suivants étant des sous-chaînes individuelles. Exemple de code : regexp.FindStringSubmatch(text,pattern) renvoie une tranche de sous-chaînes correspondantes. Cas pratique : Il peut être utilisé pour faire correspondre le nom de domaine dans l'adresse email, par exemple : email:="user@example.com", pattern:=@([^\s]+)$ pour obtenir la correspondance du nom de domaine [1].

See all articles