Dalam pembangunan sebenar, pemprosesan format teks sering terlibat, dan format pembaca e-buku adalah salah satu faktor yang perlu dipertimbangkan. Dalam artikel ini, kami akan membincangkan cara memadankan format e-pembaca menggunakan ungkapan biasa PHP.
Apakah format pembaca e-buku?
Format pembaca e-buku ialah format e-buku yang memaparkan kandungan e-buku melalui beberapa tag khas. Format pembaca e-buku biasa termasuk EPUB dan MOBI.
Format EPUB ialah format e-buku yang digunakan secara meluas yang menggunakan markup berasaskan XML untuk memaparkan kandungan e-buku. Format MOBI ialah format e-buku yang dilancarkan oleh Amazon Ia juga menggunakan beberapa tag khas untuk memaparkan kandungan e-buku.
Apabila melakukan pemadanan ungkapan biasa, kita perlu mempertimbangkan kesan teg khas ini pada teks.
Bagaimana untuk memadankan format pembaca e-buku?
Di bawah kami akan menggunakan beberapa contoh untuk memperkenalkan cara menggunakan ungkapan biasa PHP untuk memadankan format pembaca e-buku.
Dalam format EPUB, tajuk bab biasanya disertakan dalam teg <h1>
hingga <h6>
. Kita boleh menggunakan ungkapan biasa berikut untuk memadankan tajuk bab:
$pattern = "/<h[1-6]>(.+)</h[1-6]>/";
Ungkapan biasa ini menggunakan <h[1-6]>
dan </h[1-6]>
untuk memadankan teg permulaan dan akhir tajuk bab. Antaranya, [1-6]
bermaksud memadankan nombor 1 hingga 6, dan (.+)
bermaksud memadankan mana-mana aksara (kecuali aksara baris baharu).
Dalam format MOBI, imej biasanya disertakan dalam teg <img>
. Kita boleh menggunakan ungkapan biasa berikut untuk memadankan teg imej:
$pattern = "/<img.*src="(.+?)".*>/";
Ungkapan biasa ini menggunakan <img.*>
untuk memadankan permulaan teg imej. Di mana .*
bermaksud memadankan 0 atau lebih aksara arbitrari. Kemudian gunakan src="
untuk memadankan alamat pautan imej dan gunakan (.+?)
untuk memadankan mana-mana aksara dalam alamat imej. Akhir sekali gunakan .*>
untuk memadankan hujung tag imej.
Perhatikan bahawa di sini kami menggunakan ?
untuk menunjukkan mod tidak tamak, yang bermaksud bahawa proses pemadanan akan cuba memadankan rentetan terpendek untuk mengelakkan padanan terlalu banyak aksara.
Dalam format EPUB dan MOBI, nota kaki biasanya disertakan dalam teg <a>
. Kita boleh menggunakan ungkapan biasa berikut untuk memadankan teg nota kaki:
$pattern = "/<a.*href="#(.+?)".*>(.*?)</a>/";
Ungkapan biasa ini menggunakan .*
bermaksud memadankan 0 atau lebih aksara arbitrari. Kemudian gunakan href="#
untuk memadankan alamat pautan nota kaki dan gunakan (.+?)
untuk memadankan mana-mana aksara dalam pautan. Kemudian gunakan .*>
untuk memadankan hujung teg pautan.
Akhir sekali gunakan (.*?)
untuk memadankan kandungan nota kaki. Di sini kami menggunakan mod tidak tamak untuk mengelakkan padanan terlalu banyak aksara. Selain itu, kami juga menggunakan kurungan untuk menandakan kandungan nota kaki untuk pengekstrakan seterusnya.
Ringkasan:
Artikel ini menerangkan cara menggunakan ungkapan biasa PHP untuk memadankan format pembaca e-buku. Melalui contoh di atas, anda sepatutnya telah mempelajari cara menggunakan ungkapan biasa untuk memadankan teks dalam format yang berbeza. Apabila anda menghadapi situasi di mana anda perlu memadankan format teks khas dalam pembangunan sebenar, anda boleh merujuk kepada ungkapan biasa yang disebut dalam artikel ini untuk menyelesaikan masalah.
Atas ialah kandungan terperinci Ungkapan biasa PHP dalam tindakan: memadankan format e-pembaca. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!