如何在不破壞標籤的情況下截斷嵌入 HTML 的文字？-php教程-PHP中文網

首頁

後端開發

php教程

如何在不破壞標籤的情況下截斷嵌入 HTML 的文字？

Linda Hamilton

Nov 10, 2024 am 04:37 AM

How to Truncate Text with Embedded HTML Without Breaking Tags?

截斷嵌入HTML 的文字

處理包含HTML 標籤的文字時，必須確保在截斷期間進行正確處理，以避免破壞標籤或顯示無效內容。以下是如何在保持HTML 完整性的同時截斷文字：

PHP 實作：

以下PHP 函數使用正規表示式來解析HTML 並維護一個開啟的堆疊標籤：

function printTruncated($maxLength, $html, $isUtf8 = true) { ... }

登入後複製

此函數掃描HTML 輸入，識別標籤和字元實體。它確保標籤正確關閉並將字元實體計為單一字元。這種方法可確保截斷發生在有效點，而不會破壞任何 HTML 結構。

用法範例：

printTruncated(10, '<b><Hello&amp;gt;</b> <img src="world.png" alt="" /> world!'); // Outputs: 'Hello<b></b> <img src="world.png" alt="" />'

登入後複製

Python 實作：

像 BeautifulSoup 這樣的 HTML解析庫可以幫助完成這個任務Python:

from bs4 import BeautifulSoup, NavigableString

def truncate_html(text, max_length):
    soup = BeautifulSoup(text, 'lxml')
    truncated = soup.new_tag("div")
    tail = soup.new_string('')

    node_len = 0
    for node in soup.children:
        if isinstance(node, NavigableString):
            node_len += len(node)
            if node_len <= max_length:
                truncated.append(node)
            else:
                tail.append(node.string[:max_length - node_len])
                break
        else:
            node_len += len(str(node))
            truncated.append(node)
        
    return str(truncated) + str(tail)

登入後複製

用法示例：

print(truncate_html('<b><Hello&amp;gt;</b> <img src="world.png" alt="" /> world!', 10)) # Outputs: 'Hello<b></b> <img src="world.png" alt="" />'

登入後複製

結論：

透過在截斷，這些方法可確保產生的文字保持其預期結構和內容有效性。

以上是如何在不破壞標籤的情況下截斷嵌入 HTML 的文字？的詳細內容。更多資訊請關注PHP中文網其他相關文章！

本網站聲明

本文內容由網友自願投稿，版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容，請聯絡admin@php.cn

熱AI工具

熱工具

熱門話題

Java教學

1655

CakePHP 教程

1413

Laravel 教程

1306

PHP教程

1252

C# 教程

1226

Related knowledge

在PHP API中說明JSON Web令牌（JWT）及其用例。 Apr 05, 2025 am 12:04 AM

JWT是一種基於JSON的開放標準，用於在各方之間安全地傳輸信息，主要用於身份驗證和信息交換。 1.JWT由Header、Payload和Signature三部分組成。 2.JWT的工作原理包括生成JWT、驗證JWT和解析Payload三個步驟。 3.在PHP中使用JWT進行身份驗證時，可以生成和驗證JWT，並在高級用法中包含用戶角色和權限信息。 4.常見錯誤包括簽名驗證失敗、令牌過期和Payload過大，調試技巧包括使用調試工具和日誌記錄。 5.性能優化和最佳實踐包括使用合適的簽名算法、合理設置有效期、

會話如何劫持工作，如何在PHP中減輕它？ Apr 06, 2025 am 12:02 AM

會話劫持可以通過以下步驟實現：1.獲取會話ID，2.使用會話ID，3.保持會話活躍。在PHP中防範會話劫持的方法包括：1.使用session_regenerate_id()函數重新生成會話ID，2.通過數據庫存儲會話數據，3.確保所有會話數據通過HTTPS傳輸。

什麼是REST API設計原理？ Apr 04, 2025 am 12:01 AM

RESTAPI設計原則包括資源定義、URI設計、HTTP方法使用、狀態碼使用、版本控制和HATEOAS。 1.資源應使用名詞表示並保持層次結構。 2.HTTP方法應符合其語義，如GET用於獲取資源。 3.狀態碼應正確使用，如404表示資源不存在。 4.版本控制可通過URI或頭部實現。 5.HATEOAS通過響應中的鏈接引導客戶端操作。

您如何在PHP中有效處理異常（嘗試，捕捉，最後，投擲）？ Apr 05, 2025 am 12:03 AM

在PHP中，異常處理通過try,catch,finally,和throw關鍵字實現。 1)try塊包圍可能拋出異常的代碼；2)catch塊處理異常；3)finally塊確保代碼始終執行；4)throw用於手動拋出異常。這些機制幫助提升代碼的健壯性和可維護性。

PHP中的匿名類是什麼？您何時可以使用它們？ Apr 04, 2025 am 12:02 AM

匿名類在PHP中的主要作用是創建一次性使用的對象。 1.匿名類允許在代碼中直接定義沒有名字的類，適用於臨時需求。 2.它們可以繼承類或實現接口，增加靈活性。 3.使用時需注意性能和代碼可讀性，避免重複定義相同的匿名類。

包括，require，incement_once，require_once之間有什麼區別？ Apr 05, 2025 am 12:07 AM

在PHP中，include,require,include_once,require_once的區別在於：1)include產生警告並繼續執行，2)require產生致命錯誤並停止執行，3)include_once和require_once防止重複包含。這些函數的選擇取決於文件的重要性和是否需要防止重複包含，合理使用可以提高代碼的可讀性和可維護性。