HTML は Web ページの作成に使用されるマークアップ言語であり、Web 開発でよく使用されます。ただし、電子メールやテキスト メッセージを送信する場合など、HTML タグが読み取りの妨げになるのを避けるために、HTML を通常のテキストに変換する必要がある場合があります。この記事では、HTML をプレーン テキストに変換するいくつかの方法を検討します。
BeautifulSoup は、HTML および XML ドキュメントを解析するための Python ライブラリです。 HTML をプレーン テキストに変換し、簡単にカスタマイズできます。以下は、BeautifulSoup を使用して HTML をプレーン テキストに変換するサンプル コードです:
from bs4 import BeautifulSoup html = '<html><body><p>This is some <strong>bold</strong> text.</p></body></html>' soup = BeautifulSoup(html, 'html.parser') text = soup.get_text() print(text)
このコードは次のテキストを出力します:
This is some bold text.
var html = '<html><body><p>This is some <strong>bold</strong> text.</p></body></html>'; var element = document.createElement('div'); element.innerHTML = html; var text = element.innerText; console.log(text);
This is some bold text.
var html = '<html><body><p>This is some <strong>bold</strong> text.</p></body></html>'; var regex = /(<([^>]+)>)/ig; var text = html.replace(regex, ''); console.log(text);
This is some bold text.
以上がHTML をプレーン テキストに変換するいくつかの方法を検討するの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。