目錄
用strip_tags()函數去除HTML標籤
使用正規表示式移除HTML標籤
實作更精細的HTML標籤移除
總結
首頁 後端開發 PHP問題 php怎麼去除html並得到純文本

php怎麼去除html並得到純文本

Apr 10, 2023 am 09:45 AM

隨著網路的不斷發展和使用者需求的提高,越來越多的網站需要提供文字編輯功能,使用者可以在頁面上新增、編輯或刪除內容。這些內容在保存到資料庫或在頁面上展示時,通常需要經過一些處理,使它們成為純文字格式。

對於PHP程式設計師來說,去除HTML的過程也就是把一段富文本變成純文字格式的過程是重要的技能。那麼,如何使用PHP去除HTML並得到純文字呢?下面本文將就這個主題給出一些實用方法。

用strip_tags()函數去除HTML標籤

PHP中有一個strip_tags()函數,可以移除HTML標籤,得到純文字格式的字串。函數格式如下:

string strip_tags ( string $str [, string $allowable_tags ] )
登入後複製

第一個參數是要被處理的字串,第二個參數則是允許保留的標籤元素名稱。如果沒有指定第二個參數,則會移除所有HTML標籤。

例如,以下程式碼將會去掉HTML文字中所有的標籤元素,並輸出結果:

<?php
    $html = &#39;<div><p>Hello, world!</p></div>';
    $text = strip_tags($html);
    echo $text; // 输出结果:Hello, world!
?>
登入後複製

可以將上述方法進行拓展,支援保留指定標籤元素。

<?php
    $html = &#39;<div><p>Hello, world!</p><a href="www.google.com">Google</a></div>';
    $text = strip_tags($html, '<p>');
    echo $text; // 输出结果:<p>Hello, world!</p>
?>
登入後複製

使用正規表示式移除HTML標籤

除了 strip_tags() 函數外,使用正規表示式也是常見的方法。正規表示式可以符合HTML標籤,並移除它們。以下是一段範例程式碼:

<?php
    $html = &#39;<div><p>Hello, world!</p></div>';
    $text = preg_replace('/<[^>]*>/', '', $html);
    echo $text; // 输出结果:Hello, world!
?>
登入後複製

使用preg_replace()函數和正規表示式"/<1*>/",移除了HTML標籤。這個正規表示式可以匹配任何以“<”開始,“>”結束的字串,括號內的“^>”表示匹配除了“>”以外的所有字元。

實作更精細的HTML標籤移除

上述兩種方法雖然簡單有效,但會完全移除HTML標籤,包含一些格式標記,如粗體、斜體、底線等。如果不想完全移除這些標籤,而是只想保留它們的樣式,那該怎麼辦呢?

這時我們可以利用PHP DOM擴展,來實現更精細的HTML標籤去除。 PHP DOM擴展是一個功能強大且靈活的擴展,可以解析HTML、XML文檔,然後對它們進行操作,例如查詢、插入、刪除節點等。

以下是一段範例程式碼,利用PHP DOM擴充去除了HTML標籤:

<?php
    $html = &#39;<div><p><strong>Hello, </strong><i>world</i>!</p></div>';
    
    $dom = new DOMDocument();
    $dom->loadHTML($html);

    $body = $dom->getElementsByTagName('body')->item(0);
    $text = $body->textContent;

    echo $text; // 输出结果:Hello, world!
?>
登入後複製

先建立一個DOMDocument對象,然後將要處理的HTML字串傳遞給它的loadHTML()方法。接著,使用getElementsByTagName('body')->item(0)方法來取得HTML中的body元素,然後使用textContent屬性,取得body元素下所有純文字內容。最後,將得到的結果輸出到螢幕上。

總結

本文介紹了三種以PHP為基礎的方法來移除HTML標記,得到純文字。第一種是簡單的strip_tags()函數,可以實現最基礎的HTML標記去除,第二種方法則利用正則表達式的優勢,對HTML標記進行匹配去除,第三種方法則使用PHP DOM擴展,可完全控制HTML體系,更精細的控制輸出結果。大家可以依照自己的需求,彈性選擇使用。


  1. >
#

以上是php怎麼去除html並得到純文本的詳細內容。更多資訊請關注PHP中文網其他相關文章!

本網站聲明
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

Video Face Swap

Video Face Swap

使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱門文章

<🎜>:泡泡膠模擬器無窮大 - 如何獲取和使用皇家鑰匙
3 週前 By 尊渡假赌尊渡假赌尊渡假赌
北端:融合系統,解釋
3 週前 By 尊渡假赌尊渡假赌尊渡假赌

熱工具

記事本++7.3.1

記事本++7.3.1

好用且免費的程式碼編輯器

SublimeText3漢化版

SublimeText3漢化版

中文版,非常好用

禪工作室 13.0.1

禪工作室 13.0.1

強大的PHP整合開發環境

Dreamweaver CS6

Dreamweaver CS6

視覺化網頁開發工具

SublimeText3 Mac版

SublimeText3 Mac版

神級程式碼編輯軟體(SublimeText3)

熱門話題

Java教學
1664
14
CakePHP 教程
1423
52
Laravel 教程
1318
25
PHP教程
1269
29
C# 教程
1248
24