Heim > Java > javaLernprogramm > Wie teile ich durch Kommas getrennten Text auf und ignoriere dabei Kommas in Anführungszeichen?

Wie teile ich durch Kommas getrennten Text auf und ignoriere dabei Kommas in Anführungszeichen?

Barbara Streisand
Freigeben: 2024-12-02 08:16:10
Original
854 Leute haben es durchsucht

How to Split Comma-Separated Text While Ignoring Commas Within Quotes?

Aufteilen von durch Kommas getrenntem Text ohne Anführungszeichen

Bei der Verarbeitung von durch Kommas getrenntem Text mit eingebetteten Anführungszeichen ist es notwendig, Kommas in Anführungszeichen zu ignorieren Abschnitte. Dieses Problem tritt auf, wenn die Standardmethode string.split(",") in Python verwendet wird.

Betrachten Sie die folgende Zeichenfolge:

"123,test,444,\"don't split, this\",more test,1"
Nach dem Login kopieren

Das Teilen dieser Zeichenfolge mit der Standardmethode würde Folgendes ergeben Ergebnis:

["123", "test", "444", "\"don't split", " this\"", "more test", "1"]
Nach dem Login kopieren

Wie Sie sehen können, wird das Komma innerhalb des zitierten Abschnitts nicht ignoriert. Um dies zu beheben, ist ein regulärer Ausdruck erforderlich.

str.split(",(?=(?:[^\"]*\"[^\"]*\")*[^\"]*$)")
Nach dem Login kopieren

Erklärung des regulären Ausdrucks:

  • **,: Trennt die Zeichenfolge durch Kommas.
  • **(?=(d $)): Lookahead-Behauptung, die sicherstellt, dass die Aufteilung nur erfolgt, wenn darauf eine gerade Anzahl von Doubles folgt Anführungszeichen.
  • *(?:w"w"): Erfasst mehrere Zeichenfolgen in Anführungszeichen.
  • *.$ : Erfasst den verbleibenden nicht zitierten Text.

Dieser reguläre Ausdruck stellt sicher, dass nur Kommas außerhalb von zitierten Abschnitten verwendet werden werden als Trennzeichen erkannt.

Alternativ können Sie mit dem Modifikator (?x) in Python den regulären Ausdruck zur besseren Lesbarkeit in mehrere Zeilen aufteilen:

str.split("(?x)\n\
        ,          \n\
        (?=\n\
        (?:       \n\
            [^\"]*  \n\
            \"       \n\
            [^\"]*  \n\
            \"       \n\
        )*       \n\
        [^\"]*    \n\
        $        \n\
        )          \n")
Nach dem Login kopieren

Dieser Code teilt effektiv auf die Eingabezeichenfolge in eine Liste, in der jedes Element eine durch ein Komma getrennte Teilzeichenfolge außerhalb aller in Anführungszeichen gesetzten Abschnitte darstellt.

Das obige ist der detaillierte Inhalt vonWie teile ich durch Kommas getrennten Text auf und ignoriere dabei Kommas in Anführungszeichen?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Quelle:php.cn
Erklärung dieser Website
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn
Neueste Artikel des Autors
Beliebte Tutorials
Mehr>
Neueste Downloads
Mehr>
Web-Effekte
Quellcode der Website
Website-Materialien
Frontend-Vorlage