Mit dem Aufkommen des Big-Data-Zeitalters sind CSV-Dateien zu einem sehr wichtigen Datenaustauschformat geworden. Bei der täglichen Datenverarbeitung müssen wir häufig eine benutzerdefinierte Verarbeitung von CSV-Dateien durchführen, z. B. das Herausfiltern einiger Daten, das Ersetzen einiger Schlüsselwörter usw. In Python können diese Aufgaben sehr komfortabel mithilfe regulärer Ausdrücke erledigt werden. In diesem Artikel wird erläutert, wie Sie reguläre Python-Ausdrücke für die Verarbeitung von CSV-Dateien verwenden.
Zuerst müssen wir die CSV-Datei lesen. In Python kann das Lesen von CSV-Dateien einfach mit dem CSV-Modul durchgeführt werden.
csv importieren
mit open('data.csv', newline='') as csvfile:
reader = csv.reader(csvfile, delimiter=',', quotechar='"') for row in reader: print(', '.join(row))
Der obige Code liest die CSV-Datei mit dem Namen data.csv und gibt ihren Inhalt Zeile für Zeile aus. Der Parameter delimiter gibt das Trennzeichen an und quotechar gibt das Anführungszeichen an.
Als nächstes können wir reguläre Ausdrücke verwenden, um die Daten in der CSV-Datei zu filtern. Beispielsweise können wir nur Zeilen auswählen, deren erste Spalte Zahlen enthält.
import csv
import re
with open('data.csv', newline='') as csvfile:
reader = csv.reader(csvfile, delimiter=',', quotechar='"') for row in reader: if re.match(r'[0-9]+', row[0]): print(', '.join(row))
Der obige Code verwendet die Match-Funktion des re-Moduls, um alle Zeilen mit der ersten Spalte auszudrucken eine Zahl.
Zusätzlich zum Filtern von Daten können wir auch reguläre Ausdrücke verwenden, um Schlüsselwörter in CSV-Dateien zu ersetzen. Beispielsweise können wir alle Wörter, die mit Apfel beginnen, durch Orange ersetzen.
import csv
import re
with open('data.csv', newline='') as csvfile:
reader = csv.reader(csvfile, delimiter=',', quotechar='"') for row in reader: row[0] = re.sub(r'^apple', 'orange', row[0]) print(', '.join(row))
Der obige Code verwendet die Unterfunktion des re-Moduls, um alle Wörter, die mit apple beginnen, durch orange zu ersetzen.
Zuletzt müssen wir die verarbeiteten Daten in eine CSV-Datei schreiben. In Python können Sie das CSV-Modul auch zum Schreiben von CSV-Dateien verwenden.
import csv
data = [
['apple', 'banana', 'cherry'], ['dog', 'cat', 'mouse'], ['sun', 'moon', 'star']
]
with open('output.csv', 'w', newline='') as csvfile:
writer = csv.writer(csvfile, delimiter=',', quotechar='"', quoting=csv.QUOTE_MINIMAL) for row in data: writer.writerow(row)
Der obige Code schreibt die Datenliste mit dem Namen „output In“. In der CSV-Datei von csv entsprechen die Parameter delimiter und quotechar den Parametern zum Lesen der CSV-Datei, und der Parameter quoting gibt an, wie mit Anführungszeichen umgegangen werden soll.
Zusammenfassend lässt sich sagen, dass die Verwendung regulärer Python-Ausdrücke für die CSV-Dateiverarbeitung sehr einfach und bequem ist. Durch die ordnungsgemäße Verwendung regulärer Ausdrücke können wir einige komplexe Aufgaben zur Verarbeitung von CSV-Dateien problemlos implementieren.
Das obige ist der detaillierte Inhalt vonSo verwenden Sie reguläre Python-Ausdrücke für die CSV-Dateiverarbeitung. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!