社区

学习

工具库

AI工具

休闲

简体中文

首页 > 后端开发 > php教程 > php simple dom html 解析乱码

php simple dom html 解析乱码

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

发布： 2016-08-08 09:28:17

原创

1300 人浏览过

1. 乱码解决

毫无疑问, 一上来就碰到了乱码问题, 固然我已按文档所述, 所有的字符使用 UTF-8 编码:

$html = '<p>你好</p>'; $dom = new DOMDocument(); @$dom->loadHTML($html); echo $dom->documentElement->nodeValue;

登录后复制

可是, 若是改成:

$html = '<p>你好</p>'; $dom = new DOMDocument(); @$dom->loadXML($html); echo $dom->documentElement->nodeValue;

登录后复制

就没有问题. 后来才发现, 本来 loadHTML 会依靠 HTML 中的声明 meta 标签. 假如没有这样的标签, 就看成 iso-8859-1 字符集, 所以乱码. 要解决, 就给字符串加上如许的一个标签在头部:

$meta = '<meta http-equiv="Content-Type" content="text/html; charset=utf-8">'; @$dom->loadHTML($meta . $html);

登录后复制

2. 递归

HTML/XML 是递归布局, 所以必然会递归遍历:

function _pretty_html_node($node){ // 递归终止前提 // 1. XML_TEXT_NODE // 2. XML_ELEMENT_NODE // 3. 没有子节点 foreach($node->childNodes as $n){ $child_text .= _pretty_html_node($n); } // 然后对分歧的标签做不同的处置 switch($tag){ case 'a': $href = $node->getAttribute('href'); $text .= "<a href="%5C%22%24href%5C%22">$child_text</a>"; ... } return $text; }

登录后复制

3. 转义字符处置惩罚

对文本节点, 其 nodeValue 要颠末 htmlspeciachars() 转义. 由于读取 HTML/XML 时, 会对文本进行反转义, 比如 > 在内存中已经是 >了.

下载源码:pretty_html.php

Related posts:

C# 版的 SimpleXML
自架设Apache办事器过程当中的网页乱码问题
if-else对优化代码冗余度的反感化
Wordpress分页代码
用Javascript生成弹出窗口

以上就介绍了php simple dom html 解析乱码，包括了方面的内容，希望对PHP教程有兴趣的朋友有所帮助。

相关标签：

dom gt html node quot

上一篇：nginx 源码（2）运行下一篇：nginx作为php站点的负载均衡实践

本站声明

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

作者最新文章

LLM的工作方式：培训前训练，神经网络，幻觉和推理

2025-02-26 03:58:14
我将区块链和AI组合在一起以生成艺术。接下来发生了什么。

2025-02-26 03:38:10
高级及时工程：思想链（COT）

2025-02-26 03:17:10
在Sqlite中检索增强发电

2025-02-26 02:49:09
如何使用LLM驱动的样板构建自己的节点。JSAPI

2025-02-26 01:08:13
2024年编码的LLM：价格，性能和争取最佳的战斗

2025-02-26 00:46:10
提示视觉语言模型

2025-02-25 23:42:08
如何衡量大语模型的响应的可靠性

2025-02-25 22:50:13
生活的幻想

2025-02-25 21:54:11
科学家对大型语言模型的认真反映了人类思维

2025-02-25 20:45:11

最新问题

输入<html><>后是怎么变成<html></html>的

来自于 1970-01-01 08:00:00

0

0

0

angular.js - 有谁知道吗用ng-bind-html绑定html。但是html却被转义了

来自于 1970-01-01 08:00:00

0

0

0

HTML与HTML5的区别

来自于 1970-01-01 08:00:00

0

0

0

HTML总结

来自于 1970-01-01 08:00:00

0

0

0

HTML总结

来自于 1970-01-01 08:00:00

0

0

0

相关专题

更多>

热门推荐

热门教程

更多>

相关教程

热门推荐

最新课程

最新ThinkPHP 5.1全球首发视频教程(60天成就PHP大牛线上培训班课)

1438056
php入门教程之一周学会PHP

4298681
JAVA 初级入门视频教程

2670528
小甲鱼零基础入门学习Python视频教程

517179
PHP 零基础入门教程

878200

最新下载

更多>

网站特效

网站源码

网站素材

前端模板