Rumah > Java > javaTutorial > teks badan

Bagaimanakah Saya Boleh Menyesuaikan Tokenisasi Input dalam Java Menggunakan `Scanner.useDelimiter()`?

DDD
Lepaskan: 2024-11-20 04:19:02
asal
503 orang telah melayarinya

How Can I Customize Input Tokenization in Java Using `Scanner.useDelimiter()`?

Memahami Pembatas dengan Scanner.useDelimiter dalam Java

Selalunya, kami memerlukan kelas Pengimbas untuk memecahkan input kepada token berdasarkan corak tertentu, yang diketahui sebagai pembatas. Secara lalai, Pengimbas menggunakan aksara ruang putih seperti ruang, tab dan baris baharu sebagai pembatas. Walau bagaimanapun, anda boleh menetapkan pembatas tersuai menggunakan kaedah useDelimiter().

Sintaks untuk useDelimiter() adalah seperti berikut:

Scanner scanner = new Scanner(input).useDelimiter(delimiter);
Salin selepas log masuk

di mana input ialah aliran input dan pembatas ialah tersuai corak pembatas dinyatakan sebagai ungkapan biasa.

Penjelasan

Contoh yang disediakan menggunakan pembatas berikut:

",|\r\n"
Salin selepas log masuk

Pembatas ini terdiri daripada dua bahagian :

  • "," (koma): Menentukan bahawa koma harus dianggap sebagai pemisah.
  • "rn" (pemulangan pengangkutan dan baris baharu): Menunjukkan bahawa pemulangan gerabak diikuti dengan baris baharu harus dianggap sebagai pembatas.

Oleh itu, apabila menggunakan pembatas ini, pengimbas akan membahagikan input kepada token pada kedua-dua koma dan pemutusan baris.

Ungkapan Biasa

Pembatas boleh memanfaatkan keupayaan penuh ungkapan biasa. Contoh ungkapan biasa yang biasa digunakan termasuk:

  • ".": Padan dengan mana-mana aksara.
  • "s": Padan dengan mana-mana aksara. aksara ruang kosong.
  • "d": Memadankan mana-mana digit.
  • "[abc]": Memadankan mana-mana aksara dalam kurungan, jadi ini sepadan dengan 'a,' 'b,' atau 'c.'

Contoh

Pertimbangkan input berikut:

1,2,red,blue
green,4,5
Salin selepas log masuk

Menggunakan corak pembatas ",|rn", pengimbas akan menandakan input seperti berikut:

["1", "2", "red", "blue"]
["green", "4", "5"]
Salin selepas log masuk

Kesimpulan

Memahami pembatas dengan Scanner.useDelimiter() membenarkan anda untuk menyesuaikan tingkah laku tokenisasi kelas Pengimbas. Dengan menentukan ungkapan biasa sebagai pembatas, anda boleh mengawal cara input dibahagikan kepada token, membolehkan pemprosesan data teks yang lebih berbutir.

Atas ialah kandungan terperinci Bagaimanakah Saya Boleh Menyesuaikan Tokenisasi Input dalam Java Menggunakan `Scanner.useDelimiter()`?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

sumber:php.cn
Kenyataan Laman Web ini
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn
Tutorial Popular
Lagi>
Muat turun terkini
Lagi>
kesan web
Kod sumber laman web
Bahan laman web
Templat hujung hadapan