Heim > Java > javaLernprogramm > Wie kann ich die Eingabe-Tokenisierung in Java mit „Scanner.useDelimiter()' anpassen?

Wie kann ich die Eingabe-Tokenisierung in Java mit „Scanner.useDelimiter()' anpassen?

DDD
Freigeben: 2024-11-20 04:19:02
Original
576 Leute haben es durchsucht

How Can I Customize Input Tokenization in Java Using `Scanner.useDelimiter()`?

Trennzeichen mit Scanner.useDelimiter in Java verstehen

Oft benötigen wir von der Scanner-Klasse, dass sie Eingaben anhand bestimmter bekannter Muster in Token aufteilt als Trennzeichen. Standardmäßig verwendet der Scanner Leerzeichen wie Leerzeichen, Tabulatoren und Zeilenumbrüche als Trennzeichen. Sie können jedoch benutzerdefinierte Trennzeichen mithilfe der Methode useDelimiter() festlegen.

Die Syntax für useDelimiter() lautet wie folgt:

Scanner scanner = new Scanner(input).useDelimiter(delimiter);
Nach dem Login kopieren

wobei Eingabe der Eingabestream und Trennzeichen der Benutzerdefiniert ist Trennzeichenmuster, ausgedrückt als regulärer Ausdruck.

Erklärung

Das Das bereitgestellte Beispiel verwendet das folgende Trennzeichen:

",|\r\n"
Nach dem Login kopieren

Dieses Trennzeichen besteht aus zwei Teilen:

  • "," (Komma): Gibt an, dass ein Komma verwendet werden soll als Trennzeichen behandelt werden.
  • "rn" (Wagenrücklauf und Zeilenumbruch): Zeigt an dass ein Wagenrücklauf gefolgt von einem Zeilenumbruch als Trennzeichen betrachtet werden sollte.

Daher teilt der Scanner bei Verwendung dieses Trennzeichens die Eingabe sowohl an Kommas als auch an Zeilenumbrüchen in Token auf.

Reguläre Ausdrücke

Trennzeichen können die vollen Möglichkeiten regulärer Ausdrücke nutzen. Beispiele für häufig verwendete reguläre Ausdrücke sind:

  • ".": Entspricht jedem einzelnen Zeichen.
  • "s": Entspricht jedem einzelnen Zeichen Leerzeichen.
  • "d": Entspricht jedem Ziffer.
  • "[abc]": Entspricht jedem Zeichen in den Klammern, also entspricht dies 'a', 'b' oder 'c'.

Beispiel

Bedenken Sie Folgendes Eingabe:

1,2,red,blue
green,4,5
Nach dem Login kopieren

Unter Verwendung des Trennzeichenmusters „,|rn“ würde der Scanner die Eingabe wie folgt tokenisieren:

["1", "2", "red", "blue"]
["green", "4", "5"]
Nach dem Login kopieren

Schlussfolgerung

Wenn Sie Trennzeichen mit Scanner.useDelimiter() verstehen, können Sie das Tokenisierungsverhalten der Scanner-Klasse anpassen. Durch die Angabe regulärer Ausdrücke als Trennzeichen können Sie die Aufteilung der Eingabe in Token steuern und so eine detailliertere Verarbeitung von Textdaten ermöglichen.

Das obige ist der detaillierte Inhalt vonWie kann ich die Eingabe-Tokenisierung in Java mit „Scanner.useDelimiter()' anpassen?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Quelle:php.cn
Erklärung dieser Website
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn
Beliebte Tutorials
Mehr>
Neueste Downloads
Mehr>
Web-Effekte
Quellcode der Website
Website-Materialien
Frontend-Vorlage