PHP4和PHP5版本下解析XML文档的操作方法实例分析


Posted in PHP onMay 20, 2017

本文实例讲述了PHP4和PHP5版本下解析XML文档的操作方法。分享给大家供大家参考,具体如下:

在PHP网站开发与建设过程中,时常会碰到需要对XML文档进行解析,PHP4版本自带了XML解析器(sax),PHP5版本增加了SimpleXML(基于dom)的XML扩展,对XML的解析更是非常方便,今天和大家分享下在不同环境下对XML文档进行解析的方法。

XML文档

<?xml version="1.0" encoding="gbk"?>
<LeapsoulXML>
<LeapsoulInfo>
<name>Leapsoul-PHP网站开发</name>
<website>https://3water.com</website>
<description>分享PHP网站开发与建设的乐趣,教你如何建立网站</description>
<bloger>David</bloger>
<date>2009-05-13</date>
<qq>QQ:154130270</qq>
</LeapsoulInfo>
<LeapsoulInfo>
<name>Leapsoul-PHP网站开发</name>
<website>https://3water.com</website>
<description>分享PHP网站开发与建设的乐趣,教你如何建立网站</description>
<bloger>David</bloger>
<date>2009-05-13</date>
<qq>QQ:154130270</qq>
</LeapsoulInfo>
</LeapsoulXML>

PHP5版本下SimpleXML的使用方法

$info=simplexml_load_file('leapsoulcn.xml');
print_r($info);
$name=$info->LeapsoulInfo[0]->name;
echo$name;
foreach($info->LeapsoulInfoas$LeapsoulInfo)
{
echo$LeapsoulInfo->name."<br />";
echo$LeapsoulInfo->website."<br />";
echo$LeapsoulInfo->description."<br />";
echo$LeapsoulInfo->bloger."<br />";
echo$LeapsoulInfo->date."<br />";
echo$LeapsoulInfo->qq."<br />";
}
foreach($info->xpath('//name')as$value){
echo$value.'<br />';
}
foreach($info->LeapsoulInfo[0]->children()as$value){
echo$value->getName();
echo$value.'<br />';
}
$info->LeapsoulInfo[0]->addChild('msn','MSN:davidfaithman@hotmail.com');
$info->asXML('leapsoulcn.xml');

代码注释

第1行:simplexml_load_file:读取一个xml文档作为操作对象,可以读取本地或者远程xml文档;simplexml_load_string:读取一个xml字符串作为操作的对象
第3行:如果不清楚如何获取某个节点的信息,可用print_r函数打印输出查看具体的结构,simplexml解析返回的对象具有数组结构。
第5~8行:以对象方式读取某个XML文档节点信息,读取方式:句柄->节点元素名->子节点,如果相同的节点元素有多个,则以数组(array)方式读取

注:由于simplexml解析返回的信息是UTF8格式的,如果网站使用的是GBK的,则需要转码,你可以使用iconv函数或者其他的utf8与gbk转换函数进行操作,如:$name = iconv('utf-8′,'gbk',$name);

第9~17行:以遍历的形式,读取所有元素下的子节点信息
第19~21行:simplexml的xpath函数是用来查询XML数据的,比如这里查询的是所有name节点的值
第23~26行:children函数是用来找寻某个特定节点下所有子节点的值。getName函数用来获得每个子节点的元素名称
第28~29行:addChild函数用来在某个特定节点下增加一个子节点;asXML函数对已做过改动的XML文档进行保存

点击查看更多SimpleXML函数说明。

PHP4版本自带的XML函数解析方法

function doStartElement($xmlParser,$name,$attr)
{
 //对开始元素的处理
}
function doEndElement($xmlParser,$name)
{
 //对结尾元素的处理
}
function doStringData($xmlParser,$data)
{
 //对元素间的字符数据的处理
}
$xmlObj = xml_parser_create("UTF-8");
xml_set_element_handler($xmlObj,"doStartElement","doEndElement");
xml_set_character_data_handler($xmlObj,"doStringData");
xml_parse($xmlObj,file_get_contents("leapsoulcn.xml"));
xml_parser_free($xmlObj);

代码注释

第1~15行:定义开始元素,结尾元素以及元素间字符数据的处理函数
第16行:建立一个新的XML解析器并返回可被其它XML函数使用的资源句柄,输入默认编码方式为 “ISO-8859-1”。同时,支持的编码方式还有“UTF-8”和 “US-ASCII”,输出数据编码方式是和xml_parser_create函数处定义相一致。
第18行:建立起始和终止元素处理器
第20行:建立字符数据处理器,处理元素之间的相关数据
注:XML语法解析器不会加上或者去掉任何空格,空格的取舍将由开发者自己决定。
第22行:启动解析器xml_parse函数第二个参数是字符型的,所以需要读取相关的XML文档信息,此处我用的是file_get_contents函数,本地远程都可行,当然你也可以使用fopen函数
第24行:XML解析完成后,释放解析器占用的内存

自带的XML函数解析思路

第一步:自定义开始元素,结尾元素以及元素间字符数据的处理函数;
第二步:建立一个XML解析器;
第三步:建立起始和终止元素处理器;
第四步:建立字符数据处理器,处理元素之间的相关数据;
第五步:启动解析器;
第六步:XML解析完成后,释放解析器占用的内存。

总结:

总的来说PHP自带的XML解析器使用起来相当繁琐,需要有较强的逻辑,而且如果XML文档结构不同,元素、字符等3个函数需要重新定义,而在PHP5版本增加了SimpleXML扩展后,XML解析起来非常简单,当然如果你需要进行更复杂的XML文档解析操作,你也可以下载安装并使用libxml,功能相当强。

PHP 相关文章推荐
PHP 面向对象程序设计(oop)学习笔记(三) - 单例模式和工厂模式
Jun 12 PHP
对于ThinkPHP框架早期版本的一个SQL注入漏洞详细分析
Jul 04 PHP
C#静态方法与非静态方法实例分析
Sep 22 PHP
php的mssql数据库连接类实例
Nov 28 PHP
学习php设计模式 php实现备忘录模式(Memento)
Dec 09 PHP
YII Framework框架教程之安全方案详解
Mar 14 PHP
PHP 7.0新增加的特性介绍
Jun 08 PHP
php实现的mongoDB单例模式操作类
Jan 20 PHP
PHP Post获取不到非表单数据的问题解决办法
Feb 27 PHP
thinkphp5.1 文件引入路径问题及注意事项
Jun 13 PHP
laravel框架邮箱认证实现方法详解
Nov 22 PHP
php远程请求CURL案例(爬虫、保存登录状态)
Apr 01 PHP
PHP实现对xml的增删改查操作案例分析
May 19 #PHP
PHP实现对xml进行简单的增删改查(CRUD)操作示例
May 19 #PHP
php简单处理XML数据的方法示例
May 19 #PHP
PHP jQuery+Ajax结合写批量删除功能
May 19 #PHP
php对xml文件的增删改查操作实现方法分析
May 19 #PHP
PHP基于自增数据如何生成不重复的随机数示例
May 19 #PHP
Yii2设置默认控制器的两种方法
May 19 #PHP
You might like
PHP中替换键名的简易方法示例详解
2014/01/07 PHP
php 伪静态之IIS篇
2014/06/02 PHP
php通过两层过滤获取留言内容的方法
2016/07/11 PHP
PHP实现获取ip地址的5种方法,以及插入用户登录日志操作示例
2019/02/28 PHP
判断页面是关闭还是刷新的js代码
2007/01/28 Javascript
js对象数组按属性快速排序
2011/01/31 Javascript
js 实现css风格选择器(压缩后2KB)
2012/01/12 Javascript
node.js中的定时器nextTick()和setImmediate()区别分析
2014/11/26 Javascript
JavaScript将XML转成JSON的方法
2015/03/12 Javascript
javascript实时获取鼠标坐标值并显示的方法
2015/04/30 Javascript
Bootstrap表单控件学习使用
2017/03/07 Javascript
Require.js的基本用法详解
2017/07/03 Javascript
vue 注册组件的使用详解
2018/05/05 Javascript
vue组件间通信六种方式(总结篇)
2019/05/15 Javascript
vue循环数组改变点击文字的颜色
2019/10/14 Javascript
封装 axios+promise通用请求函数操作
2020/08/11 Javascript
vue-cli3自动消除console.log()的调试信息方式
2020/10/21 Javascript
Python 随机生成中文验证码的实例代码
2013/03/20 Python
Python压缩解压缩zip文件及破解zip文件密码的方法
2015/11/04 Python
如何在Django中设置定时任务的方法示例
2019/01/18 Python
Python使用itchat模块实现简单的微信控制电脑功能示例
2019/08/26 Python
Django框架 querySet功能解析
2019/09/04 Python
Python中顺序表原理与实现方法详解
2019/12/03 Python
Python常用模块os.path之文件及路径操作方法
2019/12/03 Python
Python3自定义http/https请求拦截mitmproxy脚本实例
2020/05/11 Python
static全局变量与普通的全局变量有什么区别
2014/05/27 面试题
应届生财务管理求职信
2013/11/06 职场文书
初中英语教学反思
2014/01/25 职场文书
态度决定一切演讲稿
2014/05/20 职场文书
幼儿园园长个人总结
2015/03/02 职场文书
求职简历自荐信怎么写
2015/03/26 职场文书
行政经理岗位职责
2015/04/15 职场文书
离婚答辩状范文
2015/05/22 职场文书
会计工作自我鉴定范文
2019/06/21 职场文书
Python包管理工具pip的15 个使用小技巧
2021/05/17 Python
DQL数据查询语句使用示例
2022/12/24 MySQL