Python での正規表現による文字列置換
質問:
HTML を置換するにはどうすればよいですか?正規表現を使用した文字列内のタグPython?
入力:
this is a paragraph with<[1]> in between</[1]> and then there are cases ... where the<[99]> number ranges from 1-100</[99]>. and there are many other lines in the txt files with<[3]> such tags </[3]>
必要な出力:
this is a paragraph with in between and then there are cases ... where the number ranges from 1-100. and there are many other lines in the txt files with such tags
解決策:
正規表現を使用して複数のタグを置換するにはPython では、次の手順に従います。
import re line = re.sub(r"<\/?\[\d+>]", "", line)
説明:
正規表現 r"?[d >"] は、で始まるタグと一致します。 < の後に任意の桁数が続き、> で終わります。疑問符文字 ? / の後は、スラッシュがオプションであることを示します。サブ関数は、各一致を空の文字列に置き換えます。
コメント付きバージョン:
line = re.sub(r""" (?x) # Use free-spacing mode. < # Match a literal '<' /? # Optionally match a '/' \[ # Match a literal '[' \d+ # Match one or more digits > # Match a literal '>' """, "", line)
追加メモ:
以上がPython 正規表現を使用して文字列から HTML タグを削除する方法の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。