Trennzeichen mit Scanner.useDelimiter in Java verstehen
Oft benötigen wir von der Scanner-Klasse, dass sie Eingaben anhand bestimmter bekannter Muster in Token aufteilt als Trennzeichen. Standardmäßig verwendet der Scanner Leerzeichen wie Leerzeichen, Tabulatoren und Zeilenumbrüche als Trennzeichen. Sie können jedoch benutzerdefinierte Trennzeichen mithilfe der Methode useDelimiter() festlegen.
Die Syntax für useDelimiter() lautet wie folgt:
Scanner scanner = new Scanner(input).useDelimiter(delimiter);
wobei Eingabe der Eingabestream und Trennzeichen der Benutzerdefiniert ist Trennzeichenmuster, ausgedrückt als regulärer Ausdruck.
Erklärung
Das Das bereitgestellte Beispiel verwendet das folgende Trennzeichen:
",|\r\n"
Dieses Trennzeichen besteht aus zwei Teilen:
Daher teilt der Scanner bei Verwendung dieses Trennzeichens die Eingabe sowohl an Kommas als auch an Zeilenumbrüchen in Token auf.
Reguläre Ausdrücke
Trennzeichen können die vollen Möglichkeiten regulärer Ausdrücke nutzen. Beispiele für häufig verwendete reguläre Ausdrücke sind:
Beispiel
Bedenken Sie Folgendes Eingabe:
1,2,red,blue green,4,5
Unter Verwendung des Trennzeichenmusters „,|rn“ würde der Scanner die Eingabe wie folgt tokenisieren:
["1", "2", "red", "blue"] ["green", "4", "5"]
Schlussfolgerung
Wenn Sie Trennzeichen mit Scanner.useDelimiter() verstehen, können Sie das Tokenisierungsverhalten der Scanner-Klasse anpassen. Durch die Angabe regulärer Ausdrücke als Trennzeichen können Sie die Aufteilung der Eingabe in Token steuern und so eine detailliertere Verarbeitung von Textdaten ermöglichen.
Das obige ist der detaillierte Inhalt vonWie kann ich die Eingabe-Tokenisierung in Java mit „Scanner.useDelimiter()' anpassen?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!