PHP处理XML

Jun 23, 2016 pm 02:34 PM
php处理xml

【IT168 专稿】简单,相当简单

除非你最近几年一直隐藏在洞穴里,否则你应该听说过XML(它 是越来越多的Web发布者为内容标记所求助的工具箱)了。你或许甚至已经在实际中看见过包含用户自定义标签和标记的XML文档了,而且你也许会想知道一个 人到底是如何将复杂的混乱的代码转化为人类可阅读的内容。

答案是,不容易。

虽然 PHP自版本4.0以来已经包含了对两种标准的解析(读取:变得有意义)XML方法(SAX和DOM)的支持,这些方法的复杂性和与生俱来的古怪性经常使 得除了最专业的XML开发人员外的其他开发人员放弃。然而,所有的这一切都随着PHP 5.0发生了变化,PHP 5.0介绍了一种全新的名为SimpleXML的XML扩展,该扩展消除了处理XML文档的所有(我确实是指全部)痛苦。继续阅读然后找出其是如何实现 的。

令人不愉快的旧时光

为了理解为什么SimpleXML这么酷,该到一个简短的历史课的时间了。

在 SimpleXML之前,有两种处理XML文档的方法。第一个就是SAX或者XML的简单API,它涉及遍历一个XML文档然后在解析器遇到不同类型的标 签时调用特定的函数。例如,你可能已经调用了一个函数来处理一个起始标签,另外一个函数来处理结束标签而第三个函数处理之间的数据。第二种方法是DOM或 者文档对象模型,其涉及在内存中创建一个代表XML文档的树,然后使用树遍历方法来操纵它。一旦到达树的一个特定节点,那么对应的内容就可以被检索和使用。

这 两种方法都不是特别的易于用户使用:SAX需要开发人员为XML文件中遇到的每种类型的元素定制事件处理器,而DOM方法使用面向对象模式,该模式除了内 存密集且因此对大型XML文档效率低之外而且趋向不需要开发人员。在更大的上下文中,PHP 4为其不同的XML扩展使用了大量的不同的支撑库,导致了不同的XML扩展工作方式的不一致,然后因此产生了互操作性的担忧(以及对开发人员带来的大量困 惑)。

在PHP 5.0中,通过采用libxml2库(http://www.xmlsoft.org/)作为所有XML扩展的标准库且通过使得不同的XML扩展操作更加 一致这种协调努力来修复这个问题。虽然PHP 5中XML最大的变化是由Sterling Hughes、Rob Richards和Marcus Börger开发的SimpleXML扩展,但该扩展试图使在PHP 5中解析XML文档比在PHP 4中解析XML文档更加友好。

SimpleXML 通过将XML文档转化为一个对象然后将该文档内元素转变为可以使用标准对象符号来访问的对象属性而工作。这使得向下获取XML层次结构中的任意一层的元素 以访问其内容变得容易。文档树的同一层次处的重复元素被表示为数组,同时,可定制的元素集合可以使用XPath(稍后详细介绍)位置路径来创建;这些集合 然后可以使用PHP的标准循环结构来处理。访问元素属性和访问关联数组的关键字一样简单(没有新的内容需要学习,而且也没有特殊的代码要编写)。

为 了一起使用SimpleXML和PHP,你的PHP建构必须包含对SimpleXML的支持。这种支持在PHP 5的UNIX和Windows平台的版本中默认是被激活的。阅读更多关于这方面的内容,请到http://www.php.net/manual/en /ref.simplexml.php。如果你是PHP 4的用户,那么你运气不好,SimpleXML只在PHP 5中可用。

儿童动物园

为了弄明白SimpleXML是如何工作的,请考虑下面的XML文件:

? xml version = " 1.0 " ?> Polly Parrot name > 3 age > parrot species > Pia Parrot mother > Peter Parrot father > parents > pet >

现在,你需要一种方法来获得包含在元素之间的内容。使用SimpleXML就太容易了:

php // set name of XML file $file = " pet.xml " ; // load file $xml = simplexml_load_file($file) or die ( " Unable to load XML file! " ); // access XML data echo " Name: " . $xml -> name . " \n " ; echo " Age: " . $xml -> age . " \n " ; echo " Species: " . $xml -> species . " \n " ; echo " Parents: " . $xml -> parents -> mother . " and " . $xml -> parents -> father . " \n " ; ?>

行动首先以simplexml_load_file()函数开始,该函数接受被解析的XML文件的路径和名称。文件解析的结果是一个PHP对象,该对象的 属性对应于根元素之下的元素。一个元素内的字符数据可以因而使用标准的对象->属性符号来访问,访问首先从根元素开始然后沿着文件的层次路径向下移 动。

正如你可以读取操作一样,因此你也可以写操作。SimpleXML使得修改特定XML元素的内容变得容易(简单的给对应的对象属性赋一个新值)。下面是一个例子:

php // set name of XML file $file = " pet.xml " ; // load file $xml = simplexml_load_file($file) or die ( " Unable to load XML file! " ); // modify XML data $xml -> name = " Sammy Snail " ; $xml -> age = 4 ; $xml -> species = " snail " ; $xml -> parents -> mother = " Sue Snail " ; $xml -> parents -> father = " Sid Snail " ; // write new data to file file_put_contents($file, $xml -> asXML()); ?>

这里,原始XML文件首先被读入,然后其每个元素内部的字符数据通过给对应的对象属性赋新值来修改。通常情况下被用于将XML树输出到标准输出设备上的asXML()方法在这个实例中结合file_put_contents()函数以使用新的数据覆盖原先的XML文档。

罪恶之城

在XML层次结构中同一层次的重复元素被用数组元素表示因而可以使用数字索引来访问。为了明白这是如何工作的,考虑下面的XML文件:

xml version = " 1.0 " ?> pride sin > envy sin > anger sin > greed sin > sloth sin > gluttony sin > lust sin > sins >

下面是读取该XML文件然后从中取得数据的PHP脚本:

php // set name of XML file $file = " sins.xml " ; // load file $xml = simplexml_load_file($file) or die ( " Unable to load XML file! " ); // access each echo $xml -> sin[ 0 ] . " \n " ; echo $xml -> sin[ 1 ] . " \n " ; echo $xml -> sin[ 2 ] . " \n " ; echo $xml -> sin[ 3 ] . " \n " ; echo $xml -> sin[ 4 ] . " \n " ; echo $xml -> sin[ 5 ] . " \n " ; echo $xml -> sin[ 6 ] . " \n " ; ?>

如果你喜欢,那么你甚至可以使用foreach()循环对该集合重复访问,正如下一个等价的列表:

php // set name of XML file $file = " sins.xml " ; // load file $xml = simplexml_load_file($file) or die ( " Unable to load XML file! " ); // iterate over element collection foreach ($xml -> sin as $sin) { echo " $sin\n " ; } ?>

未来事物的样子

SimpleXML可以像其操作元素一样透明地操作元素属性和它们的内容。属性-值对被表示为PHP关联数组的成员,而且可以像常规的数组元素那样被访问。为了明白这是如何工作的,请看下面的脚本:

php // create XML string $str = shapes > XML; // load string $xml = simplexml_load_string($str) or die ( " Unable to load XML string! " ); // for each shape // calculate area foreach ($xml -> shape as $shape) { if ($shape[ ' type ' ] == " circle " ) { $area = pi() * $shape[ ' radius ' ] * $shape[ ' radius ' ]; } elseif ($shape[ ' type ' ] == " rectangle " ) { $area = $shape[ ' length ' ] * $shape[ ' width ' ]; } elseif ($shape[ ' type ' ] == " square " ) { $area = $shape[ ' length ' ] * $shape[ ' length ' ]; } echo $area. " \n " ; } ?>

和之前使用外部的XMl文件的例子不同,该例子动态创建一个XML文档然后使用simplexml_load_string()方法将其加载到 SimpleXML中。然后XML使用foreach()循环来解析且其每个形状的面积在每个元素的类型属性值的基础上被计 算。上述列表展示了属性值如何作为与每个元素属性相关联的属性数组的关键字被访问。

X表示点

SimpleXML 也支持通过XPath位置路径来定制元素集合。对于那些XML新手来说,XPath是一种标准的XML文档寻址机制,该机制允许开发人员访问文档内的元 素、属性或者文本节点的集合。阅读更多关于XPath的内容,请访问http://www.w3.org/TR/xpath.html和http: //www.melonfire.com/community/columns/trog/article.php?id=83
为了明白它是如何工作的,考虑下面的XML文档:

xml version = " 1.0 " ?> Boneless chicken breasts desc > 2 quantity > item > Chopped onions desc > 2 quantity > item > Ginger desc > 1 quantity > item > Garlic desc > 1 quantity > item > Red chili powder desc > 1 quantity > item > Coriander seeds desc > 1 quantity > item > Lime juice desc > 2 quantity > item > ingredients >

现在,让我假定你想打印所有的元素。你可以像之前所讨论的那样,通过枚举元素数组来打 印元素,或者你可以使用xpath()方法只创建一个定制的只有元素的集合,然后对其进行反复:

php // set name of XML file $file = " ingredients.xml " ; // load file $xml = simplexml_load_file($file) or die ( " Unable to load XML file! " ); // get all the elements and print foreach ($xml -> xpath( ' //desc ' ) as $desc) { echo " $desc\n " ; } ?>

使用XPath,你甚至可以(举例而言)通过创建一个只有元素的集合(其对应的数量是2或者更多)而比这个更富有想象力。

php // set name of XML file $file = " ingredients.xml " ; // load file $xml = simplexml_load_file($file) or die ( " Unable to load XML file! " ); // get all the elements and print foreach ($xml -> xpath( ' //item[quantity > 1]/desc ' ) as $desc) { echo " $desc\n " ; } ?>

没有XPath,完成这个功能将会比上述五行代码复杂得多。你自己试验一下然后看看是否是这样!

红磨坊的一夜

既然你已经明白了XPath所能做的事情,那么让我们以一个你实际上可能会如何使用XPath的例子作为结尾。
让我们假定你具有一系列的以XML标示的电影评论,如下所示:

xml version = " 1.0 " ?> Moulin Rouge title > Baz Luhrmann ' s over-the-top vision of Paris at the turn of the century is witty, sexy...and completely unforgettable teaser > Nicole Kidman person > Ewan McGregor person > John Leguizamo person > Jim Broadbent person > Richard Roxburgh person > cast > Baz Luhrmann director > 120 duration > Romance / Comedy genre > 2001 year > A stylishly spectacular extravaganza, Moulin Rouge is hard to categorize; it is , at different times, a love story, a costume drama, a musical, and a comedy. Director Baz Luhrmann (well - known for the very hip William Shakespeare ' s Romeo + Juliet) has taken some simple themes - love, jealousy and obsession - and done something completely new and different with them by setting them to music. body > 5 rating > review >

现在,你打算在你的Web站点上显示该评论。因此你需要一个PHP脚本以从该文件中提取数据然后将其放置在HTML模板中的适当位置。就你目前所学到的内容而言,这很容易,就像如下代码所演示的那样:

php // set name of XML file // normally this would come through GET // it's hard-wired here for simplicity $file = " 57.xml " ; // load file $xml = simplexml_load_file($file) or die ( " Unable to load XML file! " ); ?> head > php echo $xml -> title; ?> ( php echo $xml -> year; ?> ) h1 > php echo $xml -> teaser; ?> h3 > php echo $xml -> body; ?> Director: php echo $xml -> director; ?> b > Duration: php echo $xml -> duration; ?> min b > Cast: php foreach ($xml -> cast -> person as $person) { echo "$person "; } ?> b > Rating: php echo $xml -> rating; ?> b > font > body > html >

本站声明
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn

热AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover

AI Clothes Remover

用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool

Undress AI Tool

免费脱衣服图片

Clothoff.io

Clothoff.io

AI脱衣机

Video Face Swap

Video Face Swap

使用我们完全免费的人工智能换脸工具轻松在任何视频中换脸!

热工具

记事本++7.3.1

记事本++7.3.1

好用且免费的代码编辑器

SublimeText3汉化版

SublimeText3汉化版

中文版,非常好用

禅工作室 13.0.1

禅工作室 13.0.1

功能强大的PHP集成开发环境

Dreamweaver CS6

Dreamweaver CS6

视觉化网页开发工具

SublimeText3 Mac版

SublimeText3 Mac版

神级代码编辑软件(SublimeText3)

热门话题

Java教程
1662
14
CakePHP 教程
1418
52
Laravel 教程
1311
25
PHP教程
1261
29
C# 教程
1234
24
说明PHP中的不同错误类型(注意,警告,致命错误,解析错误)。 说明PHP中的不同错误类型(注意,警告,致命错误,解析错误)。 Apr 08, 2025 am 12:03 AM

PHP中有四种主要错误类型:1.Notice:最轻微,不会中断程序,如访问未定义变量;2.Warning:比Notice严重,不会终止程序,如包含不存在文件;3.FatalError:最严重,会终止程序,如调用不存在函数;4.ParseError:语法错误,会阻止程序执行,如忘记添加结束标签。

PHP和Python:比较两种流行的编程语言 PHP和Python:比较两种流行的编程语言 Apr 14, 2025 am 12:13 AM

PHP和Python各有优势,选择依据项目需求。1.PHP适合web开发,尤其快速开发和维护网站。2.Python适用于数据科学、机器学习和人工智能,语法简洁,适合初学者。

说明PHP中的安全密码散列(例如,password_hash,password_verify)。为什么不使用MD5或SHA1? 说明PHP中的安全密码散列(例如,password_hash,password_verify)。为什么不使用MD5或SHA1? Apr 17, 2025 am 12:06 AM

在PHP中,应使用password_hash和password_verify函数实现安全的密码哈希处理,不应使用MD5或SHA1。1)password_hash生成包含盐值的哈希,增强安全性。2)password_verify验证密码,通过比较哈希值确保安全。3)MD5和SHA1易受攻击且缺乏盐值,不适合现代密码安全。

PHP行动:现实世界中的示例和应用程序 PHP行动:现实世界中的示例和应用程序 Apr 14, 2025 am 12:19 AM

PHP在电子商务、内容管理系统和API开发中广泛应用。1)电子商务:用于购物车功能和支付处理。2)内容管理系统:用于动态内容生成和用户管理。3)API开发:用于RESTfulAPI开发和API安全性。通过性能优化和最佳实践,PHP应用的效率和可维护性得以提升。

什么是HTTP请求方法(获取,发布,放置,删除等),何时应该使用? 什么是HTTP请求方法(获取,发布,放置,删除等),何时应该使用? Apr 09, 2025 am 12:09 AM

HTTP请求方法包括GET、POST、PUT和DELETE,分别用于获取、提交、更新和删除资源。1.GET方法用于获取资源,适用于读取操作。2.POST方法用于提交数据,常用于创建新资源。3.PUT方法用于更新资源,适用于完整更新。4.DELETE方法用于删除资源,适用于删除操作。

PHP:网络开发的关键语言 PHP:网络开发的关键语言 Apr 13, 2025 am 12:08 AM

PHP是一种广泛应用于服务器端的脚本语言,特别适合web开发。1.PHP可以嵌入HTML,处理HTTP请求和响应,支持多种数据库。2.PHP用于生成动态网页内容,处理表单数据,访问数据库等,具有强大的社区支持和开源资源。3.PHP是解释型语言,执行过程包括词法分析、语法分析、编译和执行。4.PHP可以与MySQL结合用于用户注册系统等高级应用。5.调试PHP时,可使用error_reporting()和var_dump()等函数。6.优化PHP代码可通过缓存机制、优化数据库查询和使用内置函数。7

PHP如何安全地上载文件? PHP如何安全地上载文件? Apr 10, 2025 am 09:37 AM

PHP通过$\_FILES变量处理文件上传,确保安全性的方法包括:1.检查上传错误,2.验证文件类型和大小,3.防止文件覆盖,4.移动文件到永久存储位置。

解释self ::,parent ::和static :: in php oop中的区别。 解释self ::,parent ::和static :: in php oop中的区别。 Apr 09, 2025 am 12:04 AM

在PHPOOP中,self::引用当前类,parent::引用父类,static::用于晚静态绑定。1.self::用于静态方法和常量调用,但不支持晚静态绑定。2.parent::用于子类调用父类方法,无法访问私有方法。3.static::支持晚静态绑定,适用于继承和多态,但可能影响代码可读性。

See all articles