実用的な例を使用して、正規表現を測定します-PHPチュートリアル-php.cn

実用的な例を使用して、正規表現を測定します

キーテイクアウト

正規表現（REGEX）は、ログ分析、フォームの提出検証、操作の検索と交換などのタスクに使用される開発者にとって貴重なツールです。正規表現を効果的に構築および使用する方法を理解することで、生産性と効率を大幅に向上させることができます。
正規表現の実用的な例には、パスワード、URL、特定のHTMLタグ、重複した単語の一致が含まれます。これらの例は、キャラクターの範囲、主張、条件、グループなどの使用を示しています。
正規表現は、検索を実行し、サブストリングを交換し、文字列データを検証するためによく使用されます。この記事では、複雑な正規表現を通過するためのヒント、トリック、リソース、およびステップを提供します。ベルトの下に基本的なスキルセットがない場合は、初心者向けガイドでRegexを学ぶことができます。正規表現のように不可解なように、概念を学ぶのにそれほど時間はかかりません。定期的な表現を説明する本、記事、ウェブサイトがたくさんあるので、別の説明を書く代わりに、より実用的な例にまっすぐに行きたいと思います。

url

複製された単語の一致
このリンクで便利なチートシートを見つけることができます。多くの有用なリソースに加えて、この投稿の下部にLea Verouによる会議ビデオもあります。少し長いですが、Regexを分解するのに最適です。
定期的な表現は、開発者の日常生活でよく使用されます - ログ分析、フォームの提出検証、検索と交換など。だからこそ、すべての優れた開発者はそれらの使用方法を知っている必要がありますが、優れたregexを構築するためのベストプラクティスは何ですか？

自然言語を使用して問題を定義することで、使用するアプローチのより良いアイデアが得られます。定義で使用される言葉は、必須の制約またはアサーションを説明するのに役立ちます。以下は例です：

文字列は「H」で開始し、「o」で終了する必要があります（Hello、Haloなど）。

文字列は括弧で巻き付けられる可能性があります。

2。計画を作成します

キャラクターが何回現れる必要があります（1つ以上、1回、…）？

従うべきいくつかの制約がありますか（オプション、lookahead/後ろ、if-then-else、…）？

3。実装/テスト/リファクタリング

正規表現をテストおよび改善するために、リアルタイムのテスト環境を用意することが非常に重要です。 Regex101.com、Regexr.com、Debuggex.comなどのWebサイトがあり、最高の環境を提供しています。正規表現の効率を向上させるために、これらの追加の質問のいくつかに答えることができます。

特定のドメインに対してキャラクタークラスは正しく定義されていますか？
より多くのユースケースをカバーするために、より多くのテスト文字列を書く必要がありますか？
いくつかの問題を見つけて分離し、それらを個別にテストすることは可能ですか？

実用的な例

次の例の目標は、問題を解決するだけの表現を書くことではなく、文字範囲、アサーション、条件、グループなどなどの重要な要素を使用して、特定のユースケースに対して最も効果的な表現を書くことです。パスワードの一致

シナリオ：

6〜12文字の長さ

少なくとも1つの大文字
少なくとも1つの小文字
少なくとも1桁の
他の文字を含める必要があります
パターン： ^（？=。*[a-z]）（？=。*[a-z]）（？=。*d）。{6,12} $ この式は、複数のポジティブルックヘッド（？=（regex））に基づいています。 Lookaheadは、宣言された（Regex）が続く何かと一致します。条件の順序は結果に影響しません。ルックアラウンド式は、いくつかの条件がある場合に非常に便利です。また、ネガティブLookahead（？！（Regex））を使用して、いくつかの文字範囲を除外することもできます。たとえば、％を（？！。*＃）で除外できます。上記の式の各パターンを説明しましょう。

^文字列の開始時に位置をアサートします

（？=。*[a-z]）ポジティブな見た目は、regex。*[a-z]が一致できると主張しています。
。
[a-z]は、aとzの間の単一の文字と一致します（ケースに敏感）
- （？=。 *d）肯定的な見た目は、regex *dcanが一致すると主張しています。
。
に一致します
$文字列の終わりに位置をアサートします

url

の一致

シナリオ：

httpまたはhttpsまたはftpで開始する必要があります。
と一致する必要があります
を含めることができます
を含めることができます

をキャプチャします
の正確に2倍に一致します
グループのキャプチャ（：[0-9]）？：
- Quantifier？ゼロ以上の間のグループを一致させます
- ：キャラクターに一致します：文字通り
- [0-9]は、0〜9の間の単一文字と一致します
/？文字通りゼロまたは1回のキャラクターに一致します
グループ（[a-za-z0-9 -._？、 '/\＆amp;％$＃=〜]*）：）：
- [a-za-z0-9 -._？、 '/\＆amp;％$＃=〜]*ゼロと無制限の時間を一致させます。：-._？、 '/＆amp;％$＃=〜。

HTMLタグの一致

シナリオ：

startタグは、
endタグは 1つ以上の文字が続き、>
タグ要素内のコンテンツを一致させる必要があります

パターン：（。*？）1> 開始タグと内部のコンテンツを一致させると、 and（。*？）で非常に簡単ですが、上記のパターンでは、有用なものを追加しました。キャプチャグループへの参照です。括弧（）で定義されたすべてのキャプチャグループは、その位置番号（最初）（2番目）（3番目）を使用して参照できます。これにより、さらなる操作が可能になります。上記の式は次のように説明できます。

で開始します
タグ名をキャプチャ
1つ以上のchars
タグ内のコンテンツをキャプチャ
閉じるタグはタグ名>

式には、タグ名とコンテンツの2つのキャプチャグループのみが含まれ、関連するコンテンツを持つタグ名のリストである非常に明確な一致を返します。もう少し深く掘り下げて、サブパターンを説明しましょう。

に一致します
グループ（[w]）キャプチャグループは、単語文字A-ZA-Z0-9_ 1回以上一致します
。
に一致します
に一致します
に一致します

複製された単語の一致

シナリオ：

です

パターン： b（w）b（？=。*1）この正規表現は挑戦的なようですが、以前に示された概念の一部を使用しています。このパターンは、単語の境界の概念を導入します。単語の境界bは主に位置をチェックします。単語文字（つまり：abcde）の後に非単語文字（つまり：-〜、！）が続く場合に一致します。以下に、単語の境界の使用例をいくつか見せて、それを明確にすることができます。 - フレーズを考えると、正規表現は素晴らしいです - パターンベアブマッチはです - パターンw {3} bは、単語の最後の3文字に一致する可能性があります：lar、ion、are、ome 上記の式は次のように説明できます。

すべての単語文字に続いて、単語以外の文字が続きます（私たちのケーススペース）
一致した単語がすでに存在しているかどうかを確認してください

以下に、各サブパターンの説明があります。

bワード境界
グループ（[w]）は、任意の単語文字a-za-z0-9_
bワード境界
（？=。*1）肯定的なLookaheadは、以下と一致できると主張しています。

最終的な考え

正規表現は両刃の剣です。複雑さが増すほど、問題を解決することがより困難になります。そのため、すべてのケースに一致する正規表現を見つけるのが難しい場合があり、代わりにいくつかの小さな正規表現を使用する方が良いでしょう。問題の優れたシナリオを持つことは非常に役立つ可能性があり、キャラクターの範囲、制約、アサーション、繰り返し、オプションの値などを考え始めることができます。グループキャプチャにより多くの注意を払うことで、さらなる処理にマッチが役立ちます。例の表現を自由に改善して、あなたのやり方を教えてください！

有用なリソース

以下に、REGEXスキルの成長を支援するためのさらなる情報とリソースをご覧ください。リストされていない便利なものが見つかった場合は、記事にコメントを追加してください。

lea verou - /reg（exp）{2}貸し出し/：正規表現を分裂させる https://www.youtube.com/watch?v=eklues9rvak

phpライブラリ

name 説明 regexpbuilder 方法の人間が読みやすいチェーンを使用して、正規表現を作成します NOONOOFLUENTREGEX 流fluentセッターと上記のような英語用語を使用して、正規表現を構築します HoareGex 正規表現を分析し、文字列を生成するためのツールを提供します正規表現逆正規表現が与えられた場合、文字列が生成されます

ウェブサイト

url 説明 regex101.com PCRE Online Regex Tester regextester.com PCRE Online Regex Tester rexv.org PCRE Online Regex Tester debuggex.com PCREをサポートし、非常に便利な視覚的なRegexデバッガーを提供します regexper.com JavaScriptスタイルのRegexですが、デバッグに役立ちます phpliveregex.com PREG機能のオンラインテスター regxlib.com 使用できる正規表現のデータベース regular-Expressions.info 正規表現チュートリアル、書籍のレビュー、例

books

タイトル説明著者編集者正規表現のマスター正規表現の本が必要ですジェフリー・フリードルオライリー正規表現ポケットリファレンス Perl、Ruby、PHP、Python、C、Java、および.Netの正規表現トニースタブビンオライリー正規表現（regex）

に関するよくある質問（FAQ）

正規表現（regex）の実用的なアプリケーションは何ですか？

正規表現（regex）は非常に用途が広く、さまざまな実用的なアプリケーションで使用できます。これらは、ユーザー入力が電子メールアドレスや電話番号などの特定の形式と一致するようにするために、データ検証で一般的に使用されています。また、Webスクレイピングで使用して、Webページから特定の情報を抽出することもできます。さらに、テキストの特定の文字列を見つけて交換したり、文字列を一連のサブストリングに分割したりするなどのタスクのテキスト処理では、正規表現を使用できます。？

複雑な正規表現の作成には、さまざまなregexコンポーネントの理解と組み合わせが含まれます。これらには、リテラル、キャラクタークラス、数量詞、およびメタカラクターが含まれます。これらのコンポーネントをさまざまな方法で組み合わせることにより、さまざまなパターンに一致する正規表現を作成できます。たとえば、メールアドレス、電話番号、またはURLに一致する正規表現を作成できます。

正規表現（regex）を使用するときに避けるべきいくつかの一般的な間違いは何ですか？

正規表現を使用する際に避けるための一般的な間違いは、DOT（。）やアスタリスクなどの特定のコンポーネントの過剰使用または誤用を含む（。 *）、これは予期しない結果につながる可能性があります。別の一般的な間違いは、文字通り解釈されることを意図している場合、特殊文字を適切に逃れないことです。さらに、正規表現はデフォルトではケースに敏感であることを覚えておくことが重要です。そのため、ケースを無視する場合は、適切なフラグを使用する必要があります。 >

正規表現をテストできるオンラインツールがいくつかあります。これらのツールは通常、正規表現とテスト文字列を入力することができ、次に正規表現に一致するテスト文字列の部分を強調表示します。これは、通常の表現をデバッグし、予想どおりに機能していることを確認するための優れた方法です。

正規表現（regex）はすべてのプログラミング言語で使用できますか？何らかの形の表現。ただし、サポートされている特定の構文と機能は、言語によって異なります。たとえば、JavaScript、Python、およびRubyはすべて正規表現をサポートしていますが、それぞれ独自の構文と機能があります。正規表現は非常に強力ですが、適切に使用されないとリソース集約型になることもあります。複雑な正規表現は、特に大きなテキストの文字列で実行に長い時間がかかる場合があります。したがって、正規表現を慎重に使用し、できるだけそれらを最適化することが重要です。

正規表現（regex）を最適化するにはどうすればよいですか？

正規表現（regex）を使用して、HTMLまたはXML？

正規表現を使用することはできますが、正規表現を使用することは可能ですが、 HTMLまたはXMLを解析するには、通常はお勧めしません。これは、HTMLとXMLには、正規表現で正確にキャプチャするのが難しいネスト構造があるためです。代わりに、通常、専用のHTMLまたはXMLパーサーを使用することをお勧めします。

正規表現（regex）の代替品は何ですか？

正規表現は非常に強力ですが、それらは常に仕事に最適なツールではありません。手元のタスクに応じて、別のアプローチを使用する方が良いかもしれません。たとえば、単純な文字列操作タスクの場合、正規表現の代わりに組み込みの文字列メソッドを使用できる場合があります。 HTMLまたはXMLを解析するには、通常、専用のパーサーを使用します。複雑なテキスト処理タスクについては、自然言語処理ライブラリの使用を検討することをお勧めします。

以上が実用的な例を使用して、正規表現を測定しますの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。