正規表現を使用した複数行のテキストの一致
Java で複数行のテキストの一致を試みると、Pattern クラスを使用した場合と動作の違いが発生する可能性があります。 Pattern.MULTILINE 修飾子を使用し、(?m) 修飾子を使用します。
矛盾があるため、これらの修飾子の目的を把握することが重要です。
Pattern.MULTILINE と (?m)
Pattern.MULTILINE と (?m) は両方とも次の目的で使用されます。正規表現アンカー (^ と $) の動作を拡張して、文字列全体の先頭と末尾だけでなく、文字列内の各行の先頭と末尾も一致させます。 string.
Pattern.DOTALL および (?s)
ただし、これらの修飾子の主な違いは、改行 (キャリッジ リターン) 文字の処理にあります。 Pattern.MULTILINE は、改行文字を含むようにドット (.) ワイルドカード文字の一致機能を拡張しません。それらを含めるには、Pattern.DOTALL または (?s) を使用する必要があります。
例の文字列との一致
この例では、文字列には複数の行が含まれており、 「User Comments:」で始まるテキストを検索したいと考えています。 Pattern.MULTILINE を単独で使用すると、アンカーは各行の先頭に一致しますが、ドット文字は改行に一致しません。
複数行のテキストを正しく一致させ、「User Comments:」の後の文字をキャプチャするには、次のようにする必要があります。 Pattern.DOTALL または (?s) を Pattern.MULTILINE または (?m) と組み合わせて使用します:
Pattern regex = Pattern.compile("^\s*User Comments:\s+(.*)", Pattern.DOTALL); Matcher regexMatcher = regex.matcher(subjectString); if (regexMatcher.find()) { ResultString = regexMatcher.group(1); }
この正規表現は先頭に一致しますさらに、「User Comments:」の後の空白以外の文字もすべてキャプチャされます。
以上がJava 正規表現で複数行のテキストを照合する場合、「Pattern.MULTILINE」と「(?m)」はどのように異なりますか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。