ホームページ バックエンド開発 Python チュートリアル 正規表現を使用して複数行のテキスト ブロックをキャプチャするにはどうすればよいですか?

正規表現を使用して複数行のテキスト ブロックをキャプチャするにはどうすればよいですか?

Oct 25, 2024 am 06:05 AM

How to Capture Multiline Text Blocks with Regular Expressions?

複数行のテキスト ブロックを一致させるための正規表現

複数行にまたがるテキストを一致させると、正規表現の構築に課題が生じる可能性があります。次のテキスト例を考えてみましょう。

some Varying TEXT

DSJFKDAFJKDAFJDSAKFJADSFLKDLAFKDSAF
[more of the above, ending with a newline]
[yep, there is a variable number of lines here]

(repeat the above a few hundred times)
ログイン後にコピー

目標は、2 つのコンポーネントをキャプチャすることです。「一部の可変テキスト」部分と、空の行を除く大文字テキストの後続のすべての行です。

間違ったアプローチ:

この問題を解決するためのいくつかの間違ったアプローチは次のとおりです:

  • 改行を一致させるために ^ アンカーと $ アンカーを使用する。複数行モードでは、^ は改行に続く位置に一致し、$ は改行に続く位置に一致します。
  • DOTALL 修飾子を使用してすべてに一致しますが、ドット (.) は改行以外のすべてに一致するため、これは不要です。

解決策:

次の正規表現は、目的のコンポーネントを正しく取得します:

^(.+)\n((?:\n.+)+)
ログイン後にコピー

そのコンポーネントの内訳は次のとおりです:

  • ^ は行の先頭に一致します。
  • (. ) は「一部の可変テキスト」部分をグループ 1 にキャプチャします。
  • n は改行文字に一致します。
  • ( (?:n. ) ) は、大文字テキストの後続のすべての行をグループ 2 にキャプチャします。 ?: 非キャプチャ グループ構造により、これらの行が個別のグループとしてキャプチャされなくなります。
  • 繰り返し演算子により、少なくとも 1 つのグループがキャプチャされます。大文字のテキストの行が存在します。

使用法:

Python でこの正規表現を使用するには、次のコードを使用できます:

<code class="python">import re

pattern = re.compile(r"^(.+)\n((?:\n.+)+)", re.MULTILINE)</code>
ログイン後にコピー

その後、match() メソッドを使用して文字列内で一致するものを見つけることができます:

<code class="python">match = pattern.match(text)
if match:
    text1 = match.group(1)
    text2 = match.group(2)</code>
ログイン後にコピー

以上が正規表現を使用して複数行のテキスト ブロックをキャプチャするにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

ホットAIツール

Undresser.AI Undress

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

Undress AI Tool

脱衣画像を無料で

Clothoff.io

Clothoff.io

AI衣類リムーバー

AI Hentai Generator

AI Hentai Generator

AIヘンタイを無料で生成します。

ホットツール

メモ帳++7.3.1

メモ帳++7.3.1

使いやすく無料のコードエディター

SublimeText3 中国語版

SublimeText3 中国語版

中国語版、とても使いやすい

ゼンドスタジオ 13.0.1

ゼンドスタジオ 13.0.1

強力な PHP 統合開発環境

ドリームウィーバー CS6

ドリームウィーバー CS6

ビジュアル Web 開発ツール

SublimeText3 Mac版

SublimeText3 Mac版

神レベルのコード編集ソフト(SublimeText3)

Pythonを使用してテキストファイルのZIPF配布を見つける方法 Pythonを使用してテキストファイルのZIPF配布を見つける方法 Mar 05, 2025 am 09:58 AM

Pythonを使用してテキストファイルのZIPF配布を見つける方法

Pythonでファイルをダウンロードする方法 Pythonでファイルをダウンロードする方法 Mar 01, 2025 am 10:03 AM

Pythonでファイルをダウンロードする方法

Pythonでの画像フィルタリング Pythonでの画像フィルタリング Mar 03, 2025 am 09:44 AM

Pythonでの画像フィルタリング

HTMLを解析するために美しいスープを使用するにはどうすればよいですか? HTMLを解析するために美しいスープを使用するにはどうすればよいですか? Mar 10, 2025 pm 06:54 PM

HTMLを解析するために美しいスープを使用するにはどうすればよいですか?

Pythonを使用してPDFドキュメントの操作方法 Pythonを使用してPDFドキュメントの操作方法 Mar 02, 2025 am 09:54 AM

Pythonを使用してPDFドキュメントの操作方法

DjangoアプリケーションでRedisを使用してキャッシュする方法 DjangoアプリケーションでRedisを使用してキャッシュする方法 Mar 02, 2025 am 10:10 AM

DjangoアプリケーションでRedisを使用してキャッシュする方法

Natural Language Toolkit(NLTK)の紹介 Natural Language Toolkit(NLTK)の紹介 Mar 01, 2025 am 10:05 AM

Natural Language Toolkit(NLTK)の紹介

TensorflowまたはPytorchで深い学習を実行する方法は? TensorflowまたはPytorchで深い学習を実行する方法は? Mar 10, 2025 pm 06:52 PM

TensorflowまたはPytorchで深い学習を実行する方法は?

See all articles