Regex untuk Mengekstrak Padanan Antara Dua Rentetan
Memandangkan fail log besar yang mengandungi rentetan berbilang baris yang disertakan dengan penanda permulaan dan penamat tertentu, matlamatnya adalah untuk mengekstrak dan mencetak hanya rentetan terpendek seperti itu. Walau bagaimanapun, penanda mula digunakan di tempat lain dalam fail, jadi regex mudah tidak akan mencukupi.
Untuk menangani perkara ini, kita boleh menggunakan ungkapan biasa berikut:
(start((?!start).)*?end)
regex ini sepadan rentetan yang:
Menggunakan Kaedah re.findall Python dengan pengubah satu baris (re.S), kita boleh mendapatkan semula semua rentetan tersebut daripada fail input:
<code class="python">import re text = """ start spam start rubbish start wait for it... profit! here end start garbage start second match win. end """ matches = re.findall('(start((?!start).)*?end)', text, re.S) print(matches)</code>
Ini akan mengeluarkan hasil yang diingini:
['start wait for it... profit! here end', 'start second match win. end']
Atas ialah kandungan terperinci Bagaimana untuk Mengekstrak Padanan Antara Dua Rentetan dalam Log dengan Regex?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!