网页编程-XML文法分析详解-XML/RSS教程-PHP中文网

首页

后端开发

XML/RSS教程

网页编程-XML文法分析详解

黄舟

Mar 24, 2017 pm 04:47 PM

在进行XML文法分析之前，首先有必要了解XML语法的基本规则：

词法特征：1）XML区分大小写，如元素名在打开和关闭标记中应保持大小写一致…，XML的保留词串应符合大小写要求 …。

　　2）XML保留标记字符为：< > &，保留字符不允许出现在元素名、元素文本、属性名、属性值中，< 用户打开标记，>用于关闭标记，&用于转意，常见的转意为 <生成<，>生成>，&生成&，&apos生成’，"生成”

　　3）元素名以下划线或字母开始，可包含字母、数字、句点、连字符、下划线、冒号和用于其他语言的扩展字符，元素名中不能有空格符（分格符、跳格符、换行符、回车符），元素名可以由名域前缀。如：元素文本可以是除XML保留字符外的字符集合，如 my money is $2000

　　4）属性名的规则同元素名，属性值由单引号或双引号括约其中，可由除XML保留字符以外的字符串组成，如：。属性名有xmlns前缀，表明该属性定义了一个名域，如：

　　句法特征：1）XML文档由一个XML说明、多个可选的文档说明、多个可选的XML指令、多个可选的XML注释和一个根元素的数据体组成，此外还可以有嵌入语句中的CDATA段，如：

<?xml …?> /*XML说明*/
　　<!DOCTYPE …> /*XML文档说明*/
　　<!-- … --> /*XML注释*/
　　<?xml-stylesheet …?> /*XML指令*/
　　<root> /*根数据元素*/
　　<child>
　　…<![CDATA[…]]>
　　</child>
　　</root>

登录后复制

　2）XML说明由标关闭，其中包含版本、编码等可选说明，如：
　　3）XML文档说明由关闭，如：
　　4)XML指令由关闭，如：
　　5）XML注释由关闭，如：
　　6）XML元素由<元素名>打开，由/>，或关闭，元素的打开和关闭标记相互匹配，如或…，XML的元素允许嵌套，应此还应保持层次上的匹配，如..。
　　7）CDTATA段由打开，由]]>关闭，用于使居于其中的语句规避XML解析规则。如：
　　根据以上的XML文法特征，可以构造出用于词法分析的正则式和用于句法分析的下推自动机结构。
　　XML词法正则式：
　　#define digit [1,2,…,9] /*数字字符*/
　　#define letter [a,b,…,z,A,B,…,Z] /*字母字符*/
　　#define signs [~, ! , @, #, %, ^, &,*,(, ), ?, :, ;, “, ‘, ,, ., /,-, _, +, =, |, /] /*符号字符*/
　　#define ascii2 [0x80,…,0xFF] /*ASCII chart2 扩展字符*/
　　#define space [0x20, /t, /r, /n] /*空格符，跳格符，回车符，换行符*/
　　#define reserve [< , >, &] /*XML保留字符*/
　　1）元素名的正则式：

　　element_name -> (_ | letter | ascii2) (ε| _ | - | : | . | digit | letter | signs | ascii2)*

登录后复制

　　2）元素文本的正则式：

　　element_text -> (ε| not reserve)*

登录后复制

　　3）属性名的正则式：

　　proper_name -> (_ | letter | ascii2) (ε| _ | - | : | . | digit | letter | signs | ascii2)*

登录后复制

　　4）属性文本的正则式：

　　proper_value -> (ε| not reserve)*

登录后复制

　XML句法结构：
　

　xml_document -> xml_header (ε| xml_declare | xml_instruct | xml_comments)* xml_element
　　xml_header -> [<?xml](space)*(proper_token)*(space)* [?>]
　　xml_declare -> [<!]reserve_word(space)*(token)*(space)*[>]
　　xml_instruct -> [<?]reserve_word(space)* (proper_token)* (space)*[?>]
　　xml_comments -> [<!--](ε| digit | letter | signs | ascii2 | space)*[-- >]
　　xml_element -> [<]element_name (space)*( ε| proper_token)*(space)*[/>] | 
　　[<]element_name(space)*( ε | proper_token)*(space)*[>]
　　[ε| <![CDATA[ ]element_text[ε| ]]>]
　　(ε | xml_element)*(space)*[</]element_name[>]
　　proper_token -> proper_name(space)*[=](space)* [ε| <![CDATA[ ] [‘ | “]proper_value[‘ | “] [ε| ]]>]
　　reserve_word -> [DOCTYPE | ELEMENT | NOTATION | …]
　　token -> (ε| not reserve)*

登录后复制

　　分析XML文法需要构造一个下推自动机，它的结构定义如下：

　　1）STACK_DFA mata_xml_doc =

　Q: {…} /*详见后面的状态集合*/
　　Σ: /*指向待解析的XML元素词串*/
　　σ: Q×Σ->Q /*状态转移函数，见状态转移列表*/
　　q: {NIL_SKIP} /*初始状态*/
　　Γ: {NIL_FAILED,NIL_SUCCEED} /*终结状态集合*/
　　S:  {Q/*状态*/, N/*DOM节点*/>,<…>} /*下推栈*/

登录后复制

　　2）栈顶符集合用于反映当前分析节点的类型：

T：{NIL/*空*/, TG/*标记*/, NS/*元素*/, IS/*指令*/, DS/*声明*/, CD/*CDATA界段*/,CM/*注释*/}

登录后复制

　　3）状态集合反映了分析的某一阶段特征，与栈顶符对应：
　

　NIL:  NIL_FAILED /*失败*/
　　NIL_SKIP /*忽略*/
　　NIL_SUCCEED /*成功*/
　　CM:  CM_BEGIN /*注释开始*/
　　CM_END /*注释结束*/
　　TG:  TG_OPEN /*标记打开*/
　　TG_INT_CLOSE /*标记中断*/
　　TG_PRE_CLOSE /*标记准备关闭*/
　　TG_CLOSE /*标记关闭*/
　　NS:  NS_NAME_BEGIN /*元素名开始*/
　　NS_NAME_END /*元素名结束*/
　　NS_KEY_BEGIN /*属性名开始*/
　　NS_KEY_END /*属性名结束*/
　　NS_ASIGN /*属性赋值*/
　　NS_VAL_BEGIN /*属性值开始*/
　　NS_VAL_END /*属性值结束*/
　　NS_TEXT_BEGIN /*元素文本开始*/
　　NS_TEXT_END /*元素文本结束*/
　　IS:  IS_OPEN /*指令打开*/
　　IS_NAME_BEGIN /*指令名开始*/
　　IS_NAME_END /*指令名结束*/
　　IS_KEY_BEGIN /*指令键开始*/
　　IS_KEY_END /*指令键结束*/
　　IS_ASIGN /*赋值符*/
　　IS_VAL_BEGIN /*指令值开始*/
　　IS_VAL_END /*指令值结束*/
　　IS_CLOSE /*指令关闭*/
　　DS:  DS_OPEN /*声明打开*/
　　DS_SKIP /*越过申明节*/
　　DS_CLOSE /*声明关闭*/
　　CD:  CD_BEGIN /*CDATA界段开始*/
　　CD_END /*CDATA界段结束*/

登录后复制

以上是网页编程-XML文法分析详解的详细内容。更多信息请关注PHP中文网其他相关文章！

本站声明

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

热AI工具

Undresser.AI Undress

人工智能驱动的应用程序，用于创建逼真的裸体照片

AI Clothes Remover

用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool

免费脱衣服图片

Clothoff.io

AI脱衣机

AI Hentai Generator

免费生成ai无尽的。

显示更多

热工具

记事本++7.3.1

好用且免费的代码编辑器

SublimeText3汉化版

中文版，非常好用

禅工作室 13.0.1

功能强大的PHP集成开发环境

Dreamweaver CS6

视觉化网页开发工具

SublimeText3 Mac版

神级代码编辑软件(SublimeText3)

显示更多

热门话题

gmail邮箱登陆入口在哪里

7552

CakePHP 教程

1382

steam的账户名称是什么格式

win11激活密钥永久

NYT连接提示和答案

显示更多

Related knowledge

手机XML转PDF，转换速度快吗？ Apr 02, 2025 pm 10:09 PM

手机XML转PDF的速度取决于以下因素：XML结构的复杂性手机硬件配置转换方法（库、算法）代码质量优化手段（选择高效库、优化算法、缓存数据、利用多线程）总体而言，没有绝对的答案，需要根据具体情况进行优化。

怎么在手机上把XML文件转换为PDF？ Apr 02, 2025 pm 10:12 PM

不可能直接在手机上用单一应用完成 XML 到 PDF 的转换。需要使用云端服务，通过两步走的方式实现：1. 在云端转换 XML 为 PDF，2. 在手机端访问或下载转换后的 PDF 文件。

手机上如何将XML转换成PDF？ Apr 02, 2025 pm 10:18 PM

直接在手机上将XML转换为PDF并不容易，但可以借助云端服务实现。推荐使用轻量级手机App上传XML文件并接收生成的PDF，配合云端API进行转换。云端API使用无服务器计算服务，选择合适的平台至关重要。处理XML解析和PDF生成时需要考虑复杂性、错误处理、安全性和优化策略。整个过程需要前端App与后端API协同工作，需要对多种技术有所了解。

web.xml怎么打开 Apr 03, 2025 am 06:51 AM

要打开 web.xml 文件，可以使用以下方法：使用文本编辑器（如记事本或 TextEdit）使用集成开发环境（如 Eclipse 或 NetBeans）使用命令行编辑命令（Windows：notepad web.xml；Mac/Linux：open -a TextEdit web.xml）

有什么手机APP可以将XML转换成PDF？ Apr 02, 2025 pm 08:54 PM

无法找到一款将 XML 直接转换为 PDF 的应用程序，因为它们是两种根本不同的格式。XML 用于存储数据，而 PDF 用于显示文档。要完成转换，可以使用编程语言和库，例如 Python 和 ReportLab，来解析 XML 数据并生成 PDF 文档。

xml格式化工具推荐 Apr 02, 2025 pm 09:03 PM

XML格式化工具可以将代码按照规则排版，提高可读性和理解性。选择工具时，要注意自定义能力、对特殊情况的处理、性能和易用性。常用的工具类型包括在线工具、IDE插件和命令行工具。

xml怎么导出pdf Apr 03, 2025 am 06:45 AM

导出 XML 为 PDF 有两种方法：使用 XSLT 和使用 XML 数据绑定库。XSLT：创建 XSLT 样式表，指定 PDF 格式使用 XSLT 处理器转换 XML 数据XML 数据绑定库：导入 XML 数据绑定库创建 PDF 文档对象加载 XML 数据导出 PDF 文件哪种方法更好取决于需求。XSLT 提供灵活性，而数据绑定库实现简单；对于简单转换，数据绑定库更好，对于复杂转换，XSLT 更合适。

xml格式怎么打开 Apr 02, 2025 pm 09:00 PM

用大多数文本编辑器即可打开XML文件；若需更直观的树状展示，可使用 XML 编辑器，如 Oxygen XML Editor 或 XMLSpy；在程序中处理 XML 数据则需使用编程语言（如 Python）与 XML 库（如 xml.etree.ElementTree）来解析。

See all articles

网页编程-XML文法分析详解

热AI工具

Undresser.AI Undress

AI Clothes Remover

Undress AI Tool

Clothoff.io

AI Hentai Generator

热门文章

热工具

记事本++7.3.1

SublimeText3汉化版

禅工作室 13.0.1

Dreamweaver CS6

SublimeText3 Mac版

热门话题