Lorsque vous utilisez Golang pour analyser des fichiers csv, vous rencontrerez parfois le problème des caractères tronqués. Cette situation est très courante, mais elle est aussi très gênante. Alors, comment résoudre ce problème ?
Tout d'abord, il faut comprendre que csv est un format de fichier texte, utilisant "," pour séparer chaque champ. Lorsque les données texte du fichier CSV contiennent des caractères non-ASCII, des caractères tronqués apparaîtront. La cause de ce problème est en réalité liée à l'encodage. Elle est généralement causée par l'incohérence entre le format d'encodage du fichier csv et le format d'encodage utilisé lors de l'analyse.
Dans Golang, la bibliothèque csv couramment utilisée est l'encodage/csv intégré. Cette bibliothèque utilise le codage UTF-8 par défaut pour analyser les fichiers csv. Si vous souhaitez traiter des fichiers CSV dans d'autres formats d'encodage, un traitement supplémentaire est requis.
Il existe plusieurs façons de résoudre le problème des caractères tronqués. Nous les présenterons une par une ci-dessous :
Méthode 1. Convertir manuellement le format d'encodage
#. 🎜🎜#Avant d'effectuer l'analyse csv, nous pouvons d'abord convertir manuellement le format d'encodage du fichier csv en UTF-8. La méthode la plus simple consiste à utiliser le Bloc-notes pour ouvrir le fichier csv et le transférer au format UTF-8. La conversion manuelle peut être gênante, surtout lorsque nous avons un grand nombre de fichiers csv. Nous pouvons donc essayer la deuxième méthode. Méthode 2. Utiliser une bibliothèque tierce La bibliothèque d'analyse csv courante dans Golang est encoding/csv Si nous devons traiter des fichiers csv dans d'autres formats d'encodage, nous Vous devez utiliser la bibliothèque tierce. Des bibliothèques tierces sont utilisées pour faciliter l'analyse. Par exemple, vous pouvez utiliser gocsv pour analyser les fichiers csv au format d'encodage gbk. méthode d'installation gocsv : $ allez chercher github.com/kuangyh/csvEnsuite, vous pouvez utiliser gocsv pour analyser le csv comme ce fichier :package main import ( "encoding/csv" "fmt" "github.com/kuangyh/csv" "os" ) func main() { file, err := os.Open("example.csv") if err != nil { fmt.Println("Error:", err) return } defer file.Close() reader := csv.NewReader(gocsv.NewReader(file)) reader.Comma = ',' lines, err := reader.ReadAll() if err != nil { fmt.Println("Error:", err) return } for i, line := range lines { fmt.Printf("Line %d: %v ", i+1, line) } }
package main import ( "bufio" "encoding/csv" "fmt" "io" "os" ) func main() { file, err := os.Open("example.csv") if err != nil { fmt.Println("Error:", err) } defer file.Close() reader := bufio.NewReader(file) var lines [][]string for { line, err := reader.ReadString(' ') if err != nil && err != io.EOF { fmt.Println("Error:", err) return } if line == "" { break } // 去除换行符 line = line[:len(line)-2] r := csv.NewReader([]byte(line)) r.Comma = ',' fields, err := r.Read() if err != nil { fmt.Println("Error:", err) return } // 将字段转换为UTF-8 for i, s := range fields { fields[i] = transform(s) } lines = append(lines, fields) } for i, line := range lines { fmt.Printf("Line %d: %v ", i+1, line) } } // 将单个字段转换为UTF-8 func transform(s string) string { data, err := ioutil.ReadAll(transform.NewReader(strings.NewReader(s), simplifiedchinese.GBK.NewDecoder())) if err != nil { return s } return string(data) }
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!