지역 사회

배우다

도구 라이브러리

AI 도구

여가

한국어

집 > 백엔드 개발 > PHP 튜토리얼 > PHP 단순 DOM HTML이 잘못된 문자를 구문 분석합니다.

PHP 단순 DOM HTML이 잘못된 문자를 구문 분석합니다.

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

풀어 주다： 2016-08-08 09:28:17

원래의

1300명이 탐색했습니다.

1. 乱码解决

毫无疑问, 一上来就碰到了乱码问题, 固然我已按文档所述, 所有的字符使用 UTF-8 编码:

$html = '<p>你好</p>'; $dom = new DOMDocument(); @$dom->loadHTML($html); echo $dom->documentElement->nodeValue;

로그인 후 복사

可是, 若是改成:

$html = '<p>你好</p>'; $dom = new DOMDocument(); @$dom->loadXML($html); echo $dom->documentElement->nodeValue;

로그인 후 복사

就没有问题. 后来才发现, 本来 loadHTML 会依靠 HTML 中的声明 meta 标签. 假如没有这样的标签, 就看成 iso-8859-1 字符集, 所以乱码. 要解决, 就给字符串加上如许的一个标签在头部:

$meta = '<meta http-equiv="Content-Type" content="text/html; charset=utf-8"/>'; @$dom->loadHTML($meta . $html);

로그인 후 복사

2. 递归

HTML/XML 是递归布局, 所以必然会递归遍历:

function _pretty_html_node($node){ // 递归终止前提 // 1. XML_TEXT_NODE // 2. XML_ELEMENT_NODE // 3. 没有子节点 foreach($node->childNodes as $n){ $child_text .= _pretty_html_node($n); } // 然后对分歧的标签做不同的处置 switch($tag){ case 'a': $href = $node->getAttribute('href'); $text .= "<a href=\"$href\">$child_text</a>"; ... } return $text; }

로그인 후 복사

3. 转义字符处置惩罚

对文本节点, 其 nodeValue 要颠末 htmlspeciachars() 转义. 由于读取 HTML/XML 时, 会对文本进行反转义, 比如 > 在内存中已经是 >了.

下载源码:pretty_html.php

Related posts:

C# 版的 SimpleXML
自架设Apache办事器过程当中的网页乱码问题
if-else对优化代码冗余度的反感化
Wordpress分页代码
用Javascript生成弹出窗口

以上就介绍了php simple dom html 解析乱码，包括了方面的内容，希望对PHP教程有兴趣的朋友有所帮助。

관련 라벨：

dom gt html node quot

이전 기사：nginx 소스 코드(2) 실행 중 다음 기사：PHP 사이트로서 nginx의 로드 밸런싱 실습

본 웹사이트의 성명

본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.

저자별 최신 기사

LLMS 작동 방식 : 사후 훈련, 신경망, 환각 및 추론에 대한 사전 훈련

2025-02-26 03:58:14
나는 블록 체인과 AI를 결합하여 예술을 생성했습니다. 다음은 다음에 일어난 일입니다.

2025-02-26 03:38:10
고급 프롬프트 엔지니어링 : 사고 체인 (COT)

2025-02-26 03:17:10
sqlite에서 증강 증강 생성

2025-02-26 02:49:09
자신의 node.js api를 구축하기 위해 LLM 구동 보일러 플레이트를 사용하는 방법

2025-02-26 01:08:13
2024 년 코딩을위한 LLMS : 가격, 성과 및 최고를위한 전투

2025-02-26 00:46:10
비전 언어 모델을 제기합니다

2025-02-25 23:42:08
큰 언어 모델의 응답의 신뢰성을 측정하는 방법

2025-02-25 22:50:13
삶의 환상

2025-02-25 21:54:11
과학자들은 인간의 사고를 반영하는 큰 언어 모델에 대해 진지하게 생각합니다.

2025-02-25 20:45:11

최신 이슈

<html><>을 입력하면 어떻게 <html></html>이 되나요?

에서 1970-01-01 08:00:00

0

0

0

javascript - vue.js와 html 페이지 간 이동

에서 1970-01-01 08:00:00

0

0

0

Gin Gonic의 HTML 템플릿에서 HTML 주석을 제거하지 않는 방법

에서 1970-01-01 08:00:00

0

0

0

HTML 콘텐츠를 다른 HTML 페이지로 보내는 방법

에서 1970-01-01 08:00:00

0

0

0

html 원하는 텍스트 크기와 위치 조정

에서 1970-01-01 08:00:00

0

0

0

관련 주제

더>

인기 추천

인기 튜토리얼

더>

관련 튜토리얼

인기 추천

최신 강좌

최신 다운로드

더>

웹 효과

웹사이트 소스 코드

웹사이트 자료

프론트엔드 템플릿