Mengapa String.replaceAll(regex) Melakukan Penggantian Berbilang untuk Ungkapan Biasa Memadankan Segala-galanya
Di Java, kaedah String.replaceAll() membenarkan untuk penggantian semua kemunculan corak ungkapan biasa dengan penggantian tertentu. Walau bagaimanapun, apabila ungkapan biasa sepadan dengan keseluruhan rentetan input, tingkah laku yang tidak dijangka boleh berlaku, mengakibatkan berbilang penggantian.
Pertimbangkan contoh yang dibentangkan:
<code class="java">System.out.println("test".replaceAll(".*", "a"));</code>
Kod ini mengeluarkan "aa" sebaliknya daripada "a" yang dijangkakan. Anomali ini timbul kerana ungkapan biasa .* sepadan dengan sebarang rentetan, termasuk rentetan kosong.
Selepas padanan awal, enjin regex cuba mencari kejadian lain dengan bermula dari penghujung input. Walau bagaimanapun, .* boleh memadankan rentetan kosong dan padanan ini berlaku pada penghujung input. Oleh itu, enjin regex menggantikan "a" pada kedudukan kosong ini.
Untuk mengelakkan tingkah laku ini dan memastikan penggantian tunggal, pertimbangkan untuk menggunakan ungkapan .* sebaliknya, yang memerlukan ungkapan biasa sepadan dengan sekurang-kurangnya satu aksara dan dengan itu tidak boleh memadankan rentetan kosong.
Sebagai alternatif, anda boleh menggunakan kaedah String.replaceFirst(), yang hanya menggantikan kejadian pertama bagi biasa yang ditentukan ungkapan.
Contohnya:
<code class="java">"test".replaceFirst(".*", "a")</code>
Kod ini akan menghasilkan output "a" yang diingini.
Perlu dinyatakan bahawa tidak semua enjin regex berkelakuan sama cara mengenai beberapa perlawanan. GNU sed, sebagai contoh, akan menganggap input habis selepas perlawanan pertama, menghalang sebarang penggantian selanjutnya.
Atas ialah kandungan terperinci Mengapakah `String.replaceAll(regex)` melakukan beberapa penggantian apabila regex sepadan dengan segala-galanya?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!