python如何清除html檔案中的內容

coldplay.xixi
發布: 2023-01-03 09:24:03
原創
2869 人瀏覽過

python清除html檔案中內容的方法:1.使用join方法,程式碼為【pat = re.compile('>(.*?)<')''.join(pat.findall (test))】;2、使用compile方法。

python如何清除html檔案中的內容

本教學操作環境:windows7系統、python3.9版,DELL G3電腦,此方法適用於所有品牌電腦。

python清除html檔案中內容的方法:

方法1:

In [97]: str_ = &#39;&#39;
    ...: flag = 1
    ...: for ele in test:
    ...:     if ele == "<":
    ...:         flag = 0
    ...:     elif ele == &#39;>&#39;:
    ...:         flag = 1
    ...:         continue
    ...:     if flag == 1:
    ...:         str_ += ele
    ...:         
In [98]: str_
Out[98]: &#39;just for testjust for testtest&#39;
In [99]: str_ = &#39;&#39;
    ...: flag = 1
    ...: for ele in test:
    ...:     if ele == "<":
    ...:         flag = 0
    ...:     elif ele == &#39;>&#39;:
    ...:         flag = 1
    ...:         ele = &#39; &#39;
    ...:     if flag == 1:
    ...:         str_ += ele
    ...:         
In [100]: str_
Out[100]: &#39; just for test   just for test  test &#39;
登入後複製

方法2:

import re
In [156]: pat = re.compile(&#39;(?<=\>).*?(?=\<)&#39;)
In [157]: pat.findall(test)
Out[157]: [&#39;just for test&#39;, &#39;&#39;, &#39;&#39;, &#39;just for test&#39;, &#39;&#39;, &#39;test&#39;]
In [158]: &#39;&#39;.join(pat.findall(test))
Out[158]: &#39;just for testjust for testtest&#39;
登入後複製

方法3:

pat = re.compile(&#39;>(.*?)<&#39;)
&#39;&#39;.join(pat.findall(test))
登入後複製

方法4:

In [167]: pat = re.compile(&#39;<[^>]+>&#39;, re.S)
In [168]: pat.sub(&#39;&#39;, test)
Out[168]: &#39;just for testjust for testtest&#39;
登入後複製

大量免費學習推薦,請造訪python教學(影片)

以上是python如何清除html檔案中的內容的詳細內容。更多資訊請關注PHP中文網其他相關文章!

相關標籤:
來源:php.cn
本網站聲明
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn
作者最新文章
熱門教學
更多>
最新下載
更多>
網站特效
網站源碼
網站素材
前端模板