삽입된 HTML로 텍스트 자르기
HTML 태그가 포함된 텍스트를 처리할 때 태그가 깨지거나 잘리는 것을 방지하려면 잘림 중에 올바르게 처리하는 것이 중요합니다. 잘못된 콘텐츠를 표시합니다. HTML의 무결성을 유지하면서 텍스트를 자르는 방법은 다음과 같습니다.
PHP 구현:
다음 PHP 함수는 정규식을 사용하여 HTML을 구문 분석하고 열린 스택을 유지 관리합니다. 태그:
function printTruncated($maxLength, $html, $isUtf8 = true) { ... }
이 함수는 HTML 입력을 검색하여 태그와 문자 엔터티를 식별합니다. 태그가 제대로 닫혔는지 확인하고 문자 엔터티를 단일 문자로 계산합니다. 이 접근 방식을 사용하면 HTML 구조를 손상시키지 않고 유효한 지점에서 잘림이 발생합니다.
사용 예:
printTruncated(10, '<b><Hello&gt;</b> <img src="world.png" alt="" /> world!'); // Outputs: 'Hello<b></b> <img src="world.png" alt="" />'
Python 구현:
BeautifulSoup과 같은 HTML 구문 분석 라이브러리는 다음에서 이 작업을 지원할 수 있습니다. Python:
from bs4 import BeautifulSoup, NavigableString def truncate_html(text, max_length): soup = BeautifulSoup(text, 'lxml') truncated = soup.new_tag("div") tail = soup.new_string('') node_len = 0 for node in soup.children: if isinstance(node, NavigableString): node_len += len(node) if node_len <= max_length: truncated.append(node) else: tail.append(node.string[:max_length - node_len]) break else: node_len += len(str(node)) truncated.append(node) return str(truncated) + str(tail)
사용 예:
print(truncate_html('<b><Hello&gt;</b> <img src="world.png" alt="" /> world!', 10)) # Outputs: 'Hello<b></b> <img src="world.png" alt="" />'
결론:
처리하는 동안 HTML 태그를 구문 분석하고 처리하여 잘림을 방지하는 방법으로 결과 텍스트가 의도한 구조와 내용을 유지하도록 보장합니다. 유효합니다.
위 내용은 태그를 깨지 않고 포함된 HTML로 텍스트를 자르는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!