Memadankan URL dengan Ungkapan Biasa
Ekspresi biasa boleh menjadi menakutkan pada mulanya, tetapi ia menawarkan keupayaan padanan corak yang hebat untuk jenis data yang pelbagai. Dalam konteks mengekstrak URL, corak yang fleksibel diperlukan untuk menampung variasi dalam format URL.
Satu ungkapan biasa yang teguh yang boleh menangkap URL dengan atau tanpa protokol utama (cth., "http://www" atau " www") ialah:
((https?|ftp)://)? // Optional SCHEME ([a-z0-9+!*(),;?&=$_.-]+(:[a-z0-9+!*(),;?&=$_.-]+)?@)? // Optional User and Pass ([a-z0-9\-\.]*)\.(([a-z]{2,4})|([0-9]{1,3}\.([0-9]{1,3})\.([0-9]{1,3}))) // Host or IP address (:[0-9]{2,5})? // Optional Port (/([a-z0-9+$_%-]\.?)+)*/? // Path (\?[a-z+&$_.-][a-z0-9;:@&%=+/$_.-]*)? // Optional GET Query (#[a-z_.-][a-z0-9+$%_.-]*)? // Optional Anchor
Untuk menggunakan ungkapan ini dalam PHP, sertakan dalam petikan berganda dan hantarkannya ke fungsi preg_match bersama-sama dengan URL yang anda ingin nilai. Contohnya:
<code class="php">$url = 'www.example.com/etcetc'; if (preg_match("~^$regex$~i", $url)) { echo 'Matched URL without protocol'; }</code>
Begitu juga, untuk URL dengan protokol:
<code class="php">$url = 'http://www.example.com/etcetc'; if (preg_match("~^$regex$~i", $url)) { echo 'Matched URL with protocol'; }</code>
Corak ini harus meliputi pelbagai format URL sambil juga melindungi daripada kemungkinan input berniat jahat yang mengandungi aksara seperti " /".
Atas ialah kandungan terperinci Bagaimana untuk Memadankan URL Menggunakan Ungkapan Biasa?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!