PHP 正規表現の練習: Web サイトのタイトルの照合
Web 開発では、Web ページのタイトルや記事の要約など、Web ページから特定の情報を抽出する必要があることがよくあります。 PHP 正規表現は、これらの関数を迅速かつ便利に実装するのに役立ちます。この記事では、PHP 正規表現を使用して Web サイトのタイトルを照合する方法を紹介します。
1. Web サイトのタイトルの構造を理解する
PHP 正規表現を使用して Web サイトのタイトルと一致させる前に、Web サイトのタイトルの構造を理解する必要があります。通常、Web サイトのタイトルには次の部分が含まれます:
1. Web サイト名: 通常、タイトルの先頭に表示され、Web サイトの名前を示します。
2. Web ページのタイトル: Web サイト名の後にあり、現在開いている Web ページのタイトルを示します。
3. 区切り文字: Web サイト名と Web ページ タイトルの間にあり、縦棒、ピリオド、その他の文字を使用して Web サイト名と Web ページ タイトルを区別できます。
たとえば、一般的な Web サイトのタイトルの構造は次のとおりです:
「XXXX.net | 最新ニュース、話題の情報、エンターテイメント ゴシップ」
この例では、 Web サイトの名前は「XX Network」、区切り文字は縦棒「|」、Web ページのタイトルは「最新ニュース、ホットな情報、エンターテイメント ゴシップ」です。
2. PHP 正規表現を使用して Web サイトのタイトルと一致させる
Web サイトのタイトルの構造を理解した後、PHP 正規表現を使用して Web サイトのタイトルと一致させることができます。
まず、一致させる Web サイトのタイトルを変数に保存する必要があります。例:
$title = "XXXX.net | 最新ニュース、注目の情報、エンターテイメント ゴシップ" ;
次に、preg_match 関数を使用して Web サイトのタイトルを照合します。 preg_match 関数の最初のパラメータは正規表現、2 番目のパラメータは一致する文字列、3 番目のパラメータは一致結果を格納するために使用される配列です。
次は、Web サイトのタイトルに一致する PHP コードです:
$title = "某某网 | 最新新闻、热点资讯、娱乐八卦"; $pattern = '/^(.*?)s*|s*(.*?)$/'; if (preg_match($pattern, $title, $matches)) { $site_name = $matches[1]; $page_title = $matches[2]; echo "网站名称:".$site_name." "; echo "网页标题:".$page_title." "; }
このコードでは、正規表現「/^(.?)s|s」を使用します。 (.?)$/」を Web サイトのタイトルと一致させます。この正規表現の意味は次のとおりです:
1.^(.?): Web サイト名と一致することを意味し、.? を使用すると可能な限り少ない文字と一致することを意味し、? は一致しないことを意味します。 -貪欲なマッチング。
2.s|s: 区切り文字の一致を意味し、s* は任意の数の空白文字の一致を意味し、| は垂直バーの一致を意味します。
3.(.?): Web ページのタイトルと一致することを示します。.? を使用すると、可能な限り少ない文字と一致することを意味します。
4.$: 一致する文字列の終わりを示します。
正規表現が $title 文字列と正常に一致した場合、$matches 配列には一致した結果が含まれます。 $matches[1] は Web サイト名を表し、$matches[2] は Web ページのタイトルを表します。
最後に、一致結果を出力します:
Web サイト名: XX.net
Web ページのタイトル: 最新ニュース、注目の情報、エンターテイメント ゴシップ
三, まとめ
この記事では、PHP 正規表現を使用して Web サイトのタイトルを照合する方法を紹介します。実際の開発では、さまざまなタイプの Web サイトのタイトルに適応するために、独自のニーズに応じて正規表現パターンを調整できます。同時に、PHP の他の機能を使用して、記事の概要や著者名などの他の情報を Web ページから抽出することもできます。
以上がPHP 正規表現の動作: Web サイトのタイトルの一致の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。