Maison > développement back-end > Golang > le corps du texte

Pourquoi la lecture et l'écriture de fichiers en Go sont-elles beaucoup plus lentes qu'en Perl ?

王林
Libérer: 2024-02-09 21:30:24
avant
897 Les gens l'ont consulté

为什么 Go 中读写文件比 Perl 慢很多?

Pourquoi la lecture et l'écriture de fichiers en Go sont-elles beaucoup plus lentes qu'en Perl ? Il s'agit d'un problème courant que de nombreux développeurs rencontrent lorsqu'ils utilisent ces deux langages de programmation. Dans cet article, l'éditeur PHP Strawberry répondra à cette question pour vous. Lorsque nous comparons la vitesse de lecture et d'écriture de fichiers entre Go et Perl, nous devons prendre en compte deux facteurs clés : les fonctionnalités du langage et l'implémentation sous-jacente. La philosophie de conception du langage Go en termes de lecture et d'écriture de fichiers est différente de celle de Perl, ce qui entraîne des différences de performances. Dans le même temps, la mise en œuvre sous-jacente est également un facteur important affectant la vitesse de lecture et d’écriture. Ensuite, nous analyserons ces facteurs en détail pour vous aider à mieux comprendre pourquoi la lecture et l'écriture de fichiers en Go sont beaucoup plus lentes qu'en Perl.

Contenu de la question

J'utilise go pour améliorer l'efficacité du code, mais lorsque j'utilise go pour lire et écrire des fichiers, je trouve que son efficacité en lecture et en écriture n'est pas aussi élevée que celle de Perl. Est-ce un problème avec mon code ou d'autres raisons ?

Construire le fichier d'entrée :

# input file:
for i in $(seq 1 600000) do     echo server$((random%800+100)),$random,$random,$random >> sample.csv done
Copier après la connexion

Lire et écrire des fichiers en utilisant Perl :

time cat sample.csv | perl -ne 'chomp;print"$_"' > out.txt
Copier après la connexion
real    0m0.249s
user    0m0.083s
sys 0m0.049s
Copier après la connexion

Utilisez go pour lire et écrire des fichiers :

package main

import (
    "bufio"
    "fmt"
    "io"
    "os"
    "strings"
)

func main() {

    filepath := "./sample.csv"
    file, err := os.openfile(filepath, os.o_rdwr, 0666)
    if err != nil {
        fmt.println("open file error!", err)
        return
    }
    defer file.close()
    buf := bufio.newreader(file)
    for {
        line, err := buf.readstring('\n')
        line = strings.trimspace(line)
        fmt.println(line)
        if err != nil {
            if err == io.eof {
                fmt.println("file read ok!")
                break
            } else {
                fmt.println("read file error!", err)
                return
            }
        }
    }
}
Copier après la connexion

Puis je cours :

time go run read.go > out.txt
Copier après la connexion
real    0m2.332s
user    0m0.326s
sys 0m2.038s
Copier après la connexion

Pourquoi la vitesse de lecture et d'écriture de Go est-elle près de 10 fois plus lente que celle de Perl ?

Solution

Vous comparez des pommes avec des oranges.

Il y a au moins deux erreurs de méthode :

  1. Votre mantra Perl mesure cat 如何读取文件并通过 pipe(2) 发送其内容,而 perl lit les données à partir de là, les traite et écrit les résultats sur sa sortie standard.

  2. Votre sort Go

    • Mesurez le processus de construction complet de la chaîne d'outils go (y compris la compilation, la liaison et l'écriture du fichier image exécutable) Puis exécutez composants d'un programme compilé, et
    • Mesure les écritures sans tampon sur la sortie standard (fmt.print* appels) lors de l'écriture sur la sortie standard à partir du code Perl - citant les docs - "Si la sortie est vers un terminal, la mise en mémoire tampon de ligne est généralement possible, sinon la mise en mémoire tampon de bloc est possible."
  3. Essayons de comparer des pommes avec des pommes.

Tout d’abord, voici une implémentation go similaire :

package main

import (
    "bufio"
    "bytes"
    "fmt"
    "os"
)

func main() {
    in := bufio.newscanner(os.stdin)
    out := bufio.newwriter(os.stdout)

    for in.scan() {
        s := bytes.trimspace(in.bytes())

        if _, err := out.write(s); err != nil {
            fmt.fprint(os.stderr, "failed to write file:", err)
            os.exit(1)
        }
    }

    if err := out.flush(); err != nil {
        fmt.fprint(os.stderr, "failed to write file:", err)
        os.exit(1)
    }

    if err := in.err(); err != nil {
        fmt.fprint(os.stderr, "reading failed:", err)
        os.exit(1)
    }
}
Copier après la connexion

Enregistrons-le sous

et mesurons-le :

chomp.go

    Code de construction :
  1. $ go build chomp.go

  2. Générer le fichier d'entrée :
  3. $ for i in $(seq 1 600000);执行 echo server$((random%800+100)),$random,$random,$random;完成 >sample.csv

  4. Exécuter le code Perl :
  5. $ time { perl -ne 'chomp; print "$_";' <sample.csv >out1.txt; }
    
    real    0m0.226s
    user    0m0.102s
    sys 0m0.048s
    Copier après la connexion

  6. Exécutez-le à nouveau pour vous assurer qu'il a lu le fichier d'entrée à partir du cache du système de fichiers :
  7. $ time { perl -ne 'chomp; print "$_";' <sample.csv >out1.txt; }
    
    real   0m0.123s
    user   0m0.090s
    sys    0m0.033s
    Copier après la connexion

    Remarquez comment le temps d'exécution est réduit.

  8. Exécutez le code Go sur l'entrée mise en cache :
  9. $ time { ./chomp <sample.csv >out2.txt; }
    
    real   0m0.063s
    user   0m0.032s
    sys    0m0.032s
    Copier après la connexion

    Assurez-vous que les résultats sont les mêmes :
  10. $ cmp out1.txt out2.txt

  11. Comme vous pouvez le voir, sur mon système avec un SSD, les résultats sont à peu près les mêmes.

    linux/amd64Eh bien, je dois également souligner que pour obtenir des résultats raisonnables, vous devrez exécuter chaque commande, disons 1 000 fois, faire la moyenne des résultats dans chaque lot, puis comparer les chiffres, mais je pense que cela suffit pour prouver ce que vous êtes. Le problème avec la méthode est.

    Encore une chose à considérer : le temps d'exécution de ces deux programmes est largement dominé par les E/S du système de fichiers, donc si vous pensez que cela sera plus rapide, vos attentes sont infondées : ces deux programmes sont volumineux Une partie du temps

    dormir

    dans le système du noyau appelle read(2) et write(2 ). Un programme go peut être plus rapide qu'un programme Perl dans certains cas impliquant des opérations CPU (surtout s'il est écrit pour tirer parti d'un système multicœur), mais ce n'est pas du tout le cas avec votre exemple. read(2)write(2) Oh, juste pour que ce soit clair : même si la spécification du langage go ne dit pas

    aot

    , et go run est un hack pour des concerts ponctuels et ponctuels, pas travail sérieux, il n’exécute pas non plus de code d’une complexité sérieuse. En bref, go-that-you-are-use n'est pas un langage interprété, bien que la disponibilité de go run puisse le faire paraître tel. En effet, il fait ce que go build normal ferait, puis exécute l'exécutable résultant, puis le supprime. go run 是一种针对一次性一次性演出的 hack,严肃的工作,也不执行任何严重复杂程度的代码。简而言之,go-that-you-are-using 并不是一种解释性语言,尽管 go run 的可用性可能使它看起来如此。事实上,它执行正常 go build

    Vous pourriez être tenté de dire que Perl gère également le "code source", mais l'interpréteur Perl est hautement optimisé pour la gestion des scripts et la chaîne d'outils de construction de Go - tout en étant incroyablement rapide par rapport à la plupart des autres langages compilés - n'est pas conçue pour cela. optimisé.
    La différence la plus évidente est peut-être que l'interpréteur Perl interprètevotre script (très simple), alors que chompprint 是所谓的“内置函数”,很容易提供给由解释器执行脚本。与构建 go 程序相比,编译器解析源代码文件并将其转换为机器代码,链接器实际上读取 go 标准库的编译包的文件 - 所有这些都是 imported, - 从它们,组合所有这些机器代码并写出一个可执行图像文件(这很像 perlle binaire lui-même ! ); bien sûr, il s’agit d’un processus très consommateur de ressources et n’a rien à voir avec l’exécution réelle du programme.

    Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Étiquettes associées:
source:stackoverflow.com
Déclaration de ce site Web
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn
Tutoriels populaires
Plus>
Derniers téléchargements
Plus>
effets Web
Code source du site Web
Matériel du site Web
Modèle frontal