Rumah > pembangunan bahagian belakang > tutorial php > Bagaimana untuk Memotong Teks dengan HTML Terbenam Tanpa Memecahkan Teg?

Bagaimana untuk Memotong Teks dengan HTML Terbenam Tanpa Memecahkan Teg?

Linda Hamilton
Lepaskan: 2024-11-10 04:37:02
asal
850 orang telah melayarinya

How to Truncate Text with Embedded HTML Without Breaking Tags?

Memotong Teks dengan HTML Terbenam

Apabila berurusan dengan teks yang mengandungi teg HTML, adalah penting untuk memastikan pengendalian yang betul semasa pemotongan untuk mengelakkan teg pecah atau memaparkan kandungan yang tidak sah. Begini cara anda boleh memotong teks sambil mengekalkan integriti HTML:

Pelaksanaan PHP:

Fungsi PHP berikut menggunakan ungkapan biasa untuk menghuraikan HTML dan mengekalkan timbunan terbuka tag:

function printTruncated($maxLength, $html, $isUtf8 = true) { ... }
Salin selepas log masuk

Fungsi ini mengimbas input HTML, mengenal pasti tag dan entiti aksara. Ia memastikan bahawa tag ditutup dengan betul dan mengira entiti aksara sebagai aksara tunggal. Pendekatan ini memastikan pemangkasan berlaku pada titik yang sah tanpa melanggar sebarang struktur HTML.

Contoh Penggunaan:

printTruncated(10, '<b><Hello&amp;gt;</b> <img src="world.png" alt="" /> world!'); // Outputs: 'Hello<b></b> <img src="world.png" alt="" />'
Salin selepas log masuk

Pelaksanaan Python:

Pustaka penghuraian HTML seperti BeautifulSoup boleh membantu dengan tugasan ini Python:

from bs4 import BeautifulSoup, NavigableString

def truncate_html(text, max_length):
    soup = BeautifulSoup(text, 'lxml')
    truncated = soup.new_tag("div")
    tail = soup.new_string('')

    node_len = 0
    for node in soup.children:
        if isinstance(node, NavigableString):
            node_len += len(node)
            if node_len <= max_length:
                truncated.append(node)
            else:
                tail.append(node.string[:max_length - node_len])
                break
        else:
            node_len += len(str(node))
            truncated.append(node)
        
    return str(truncated) + str(tail)
Salin selepas log masuk

Contoh Penggunaan:

print(truncate_html('<b><Hello&amp;gt;</b> <img src="world.png" alt="" /> world!', 10)) # Outputs: 'Hello<b></b> <img src="world.png" alt="" />'
Salin selepas log masuk

Kesimpulan:

Dengan menghuraikan dan mengendalikan tag HTML semasa pemangkasan, kaedah ini memastikan teks yang terhasil mengekalkan struktur yang dimaksudkan dan kesahihan kandungannya.

Atas ialah kandungan terperinci Bagaimana untuk Memotong Teks dengan HTML Terbenam Tanpa Memecahkan Teg?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

sumber:php.cn
Kenyataan Laman Web ini
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn
Artikel terbaru oleh pengarang
Tutorial Popular
Lagi>
Muat turun terkini
Lagi>
kesan web
Kod sumber laman web
Bahan laman web
Templat hujung hadapan