Strings mit mehreren Trennzeichen in Python aufteilen
Viele Aufgaben in der Programmierung beinhalten die Manipulation von Strings. Wenn Sie mit Zeichenfolgen arbeiten, die mehrere Trennzeichen wie Semikolons und Kommas enthalten, ist deren effiziente Aufteilung unerlässlich.
Verwendung regulärer Ausdrücke
Ein gängiger Ansatz ist die Verwendung regulärer Ausdrücke. Betrachten Sie die Beispielzeichenfolge:
"b-staged divinylsiloxane-bis-benzocyclobutene [124221-30-3], mesitylene [000108-67-8]; polymerized 1,2-dihydro-2,2,4- trimethyl quinoline [026780-96-1]"
Um diese Zeichenfolge entweder durch ein Semikolon oder ein Komma gefolgt von einem Leerzeichen zu teilen, können wir den folgenden regulären Ausdruck verwenden:
'; |, '
Dieses Muster stimmt überein entweder ein Semikolon oder ein Komma gefolgt von einem Leerzeichen. Mit der Funktion re.split() können wir die Zeichenfolge wie folgt teilen:
import re re.split('; |, ', "b-staged divinylsiloxane-bis-benzocyclobutene [124221-30-3], mesitylene [000108-67-8]; polymerized 1,2-dihydro-2,2,4- trimethyl quinoline [026780-96-1]")
Hinweis: Einzelne Kommas ohne nachgestellte Leerzeichen werden nicht geteilt.
Update: Erweitertes Trennzeichenmuster
Die angegebene Lösung kann weiter erweitert werden, um zusätzliche Trennzeichen einzuschließen. Um beispielsweise die folgende Zeichenfolge durch Semikolons, Kommas, Sternchen und Zeilenumbrüche aufzuteilen:
"Beautiful, is; better*than\nugly"
Der reguläre Ausdruck würde wie folgt lauten:
'; |, |\*|\n'
Mit der Funktion re.split() wie zuvor:
re.split('; |, |\*|\n', 'Beautiful, is; better*than\nugly')
Dies würde zu folgendem Split-Ergebnis führen:
['Beautiful', 'is', 'better', 'than', 'ugly']
Das obige ist der detaillierte Inhalt vonWie kann ich Zeichenfolgen mit mehreren Trennzeichen in Python mithilfe regulärer Ausdrücke teilen?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!