PHP4和PHP5版本下解析XML文档的操作方法实例分析


Posted in PHP onMay 20, 2017

本文实例讲述了PHP4和PHP5版本下解析XML文档的操作方法。分享给大家供大家参考,具体如下:

在PHP网站开发与建设过程中,时常会碰到需要对XML文档进行解析,PHP4版本自带了XML解析器(sax),PHP5版本增加了SimpleXML(基于dom)的XML扩展,对XML的解析更是非常方便,今天和大家分享下在不同环境下对XML文档进行解析的方法。

XML文档

<?xml version="1.0" encoding="gbk"?>
<LeapsoulXML>
<LeapsoulInfo>
<name>Leapsoul-PHP网站开发</name>
<website>https://3water.com</website>
<description>分享PHP网站开发与建设的乐趣,教你如何建立网站</description>
<bloger>David</bloger>
<date>2009-05-13</date>
<qq>QQ:154130270</qq>
</LeapsoulInfo>
<LeapsoulInfo>
<name>Leapsoul-PHP网站开发</name>
<website>https://3water.com</website>
<description>分享PHP网站开发与建设的乐趣,教你如何建立网站</description>
<bloger>David</bloger>
<date>2009-05-13</date>
<qq>QQ:154130270</qq>
</LeapsoulInfo>
</LeapsoulXML>

PHP5版本下SimpleXML的使用方法

$info=simplexml_load_file('leapsoulcn.xml');
print_r($info);
$name=$info->LeapsoulInfo[0]->name;
echo$name;
foreach($info->LeapsoulInfoas$LeapsoulInfo)
{
echo$LeapsoulInfo->name."<br />";
echo$LeapsoulInfo->website."<br />";
echo$LeapsoulInfo->description."<br />";
echo$LeapsoulInfo->bloger."<br />";
echo$LeapsoulInfo->date."<br />";
echo$LeapsoulInfo->qq."<br />";
}
foreach($info->xpath('//name')as$value){
echo$value.'<br />';
}
foreach($info->LeapsoulInfo[0]->children()as$value){
echo$value->getName();
echo$value.'<br />';
}
$info->LeapsoulInfo[0]->addChild('msn','MSN:davidfaithman@hotmail.com');
$info->asXML('leapsoulcn.xml');

代码注释

第1行:simplexml_load_file:读取一个xml文档作为操作对象,可以读取本地或者远程xml文档;simplexml_load_string:读取一个xml字符串作为操作的对象
第3行:如果不清楚如何获取某个节点的信息,可用print_r函数打印输出查看具体的结构,simplexml解析返回的对象具有数组结构。
第5~8行:以对象方式读取某个XML文档节点信息,读取方式:句柄->节点元素名->子节点,如果相同的节点元素有多个,则以数组(array)方式读取

注:由于simplexml解析返回的信息是UTF8格式的,如果网站使用的是GBK的,则需要转码,你可以使用iconv函数或者其他的utf8与gbk转换函数进行操作,如:$name = iconv('utf-8′,'gbk',$name);

第9~17行:以遍历的形式,读取所有元素下的子节点信息
第19~21行:simplexml的xpath函数是用来查询XML数据的,比如这里查询的是所有name节点的值
第23~26行:children函数是用来找寻某个特定节点下所有子节点的值。getName函数用来获得每个子节点的元素名称
第28~29行:addChild函数用来在某个特定节点下增加一个子节点;asXML函数对已做过改动的XML文档进行保存

点击查看更多SimpleXML函数说明。

PHP4版本自带的XML函数解析方法

function doStartElement($xmlParser,$name,$attr)
{
 //对开始元素的处理
}
function doEndElement($xmlParser,$name)
{
 //对结尾元素的处理
}
function doStringData($xmlParser,$data)
{
 //对元素间的字符数据的处理
}
$xmlObj = xml_parser_create("UTF-8");
xml_set_element_handler($xmlObj,"doStartElement","doEndElement");
xml_set_character_data_handler($xmlObj,"doStringData");
xml_parse($xmlObj,file_get_contents("leapsoulcn.xml"));
xml_parser_free($xmlObj);

代码注释

第1~15行:定义开始元素,结尾元素以及元素间字符数据的处理函数
第16行:建立一个新的XML解析器并返回可被其它XML函数使用的资源句柄,输入默认编码方式为 “ISO-8859-1”。同时,支持的编码方式还有“UTF-8”和 “US-ASCII”,输出数据编码方式是和xml_parser_create函数处定义相一致。
第18行:建立起始和终止元素处理器
第20行:建立字符数据处理器,处理元素之间的相关数据
注:XML语法解析器不会加上或者去掉任何空格,空格的取舍将由开发者自己决定。
第22行:启动解析器xml_parse函数第二个参数是字符型的,所以需要读取相关的XML文档信息,此处我用的是file_get_contents函数,本地远程都可行,当然你也可以使用fopen函数
第24行:XML解析完成后,释放解析器占用的内存

自带的XML函数解析思路

第一步:自定义开始元素,结尾元素以及元素间字符数据的处理函数;
第二步:建立一个XML解析器;
第三步:建立起始和终止元素处理器;
第四步:建立字符数据处理器,处理元素之间的相关数据;
第五步:启动解析器;
第六步:XML解析完成后,释放解析器占用的内存。

总结:

总的来说PHP自带的XML解析器使用起来相当繁琐,需要有较强的逻辑,而且如果XML文档结构不同,元素、字符等3个函数需要重新定义,而在PHP5版本增加了SimpleXML扩展后,XML解析起来非常简单,当然如果你需要进行更复杂的XML文档解析操作,你也可以下载安装并使用libxml,功能相当强。

PHP 相关文章推荐
php生成随机密码的三种方法小结
Sep 04 PHP
PHP 获取远程网页内容的代码(fopen,curl已测)
Jun 06 PHP
PHP中使用crypt()实现用户身份验证的代码
Sep 05 PHP
解析php dirname()与__FILE__常量的应用
Jun 24 PHP
php 删除cookie方法详解
Dec 01 PHP
CodeIgniter集成smarty的方法详解
May 26 PHP
浅谈PHP面向对象之访问者模式+组合模式
May 22 PHP
PHP 返回数组后处理方法(开户成功后弹窗提示)
Jul 03 PHP
php实现支持中文的文件下载功能示例
Aug 30 PHP
thinkphp整合系列之极验滑动验证码geetest功能
Jun 18 PHP
php自定义排序uasort函数示例【二维数组按指定键值排序】
Jun 19 PHP
laravel5表单唯一验证的实例代码
Sep 30 PHP
PHP实现对xml的增删改查操作案例分析
May 19 #PHP
PHP实现对xml进行简单的增删改查(CRUD)操作示例
May 19 #PHP
php简单处理XML数据的方法示例
May 19 #PHP
PHP jQuery+Ajax结合写批量删除功能
May 19 #PHP
php对xml文件的增删改查操作实现方法分析
May 19 #PHP
PHP基于自增数据如何生成不重复的随机数示例
May 19 #PHP
Yii2设置默认控制器的两种方法
May 19 #PHP
You might like
提取HTML标签
2006/10/09 PHP
PHP Stream_*系列函数
2010/08/01 PHP
php下尝试使用GraphicsMagick的缩略图功能
2011/01/01 PHP
php入门之连接mysql数据库的一个类
2012/04/21 PHP
php结合curl实现多线程抓取
2015/07/09 PHP
php多文件打包下载的实例代码
2017/07/12 PHP
PHP内存溢出优化代码详解
2021/02/26 PHP
实用javaScript技术-屏蔽类
2006/08/15 Javascript
原生javascript获取元素样式属性值的方法
2010/12/25 Javascript
js使用removeChild方法动态删除div元素
2014/08/01 Javascript
JQuery插件jcarousellite的参数中文说明
2015/05/11 Javascript
JavaScript代码性能优化总结(推荐)
2016/05/16 Javascript
原生js实现手风琴功能(支持横纵向调用)
2017/01/13 Javascript
Angularjs2不同组件间的通信实例代码
2017/05/06 Javascript
基于Node的React图片上传组件实现实例代码
2017/05/10 Javascript
nodeJS实现简单网页爬虫功能的实例(分享)
2017/06/08 NodeJs
vue中计算属性(computed)、methods和watched之间的区别
2017/07/27 Javascript
vue+node+webpack环境搭建教程
2017/11/05 Javascript
wx-charts 微信小程序图表插件的具体使用
2019/08/18 Javascript
Python中的pygal安装和绘制直方图代码分享
2017/12/08 Python
numpy自动生成数组详解
2017/12/15 Python
在python里从协程返回一个值的示例
2019/02/19 Python
python requests使用socks5的例子
2019/07/25 Python
tensorflow中tf.reduce_mean函数的使用
2020/04/19 Python
keras模型保存为tensorflow的二进制模型方式
2020/05/25 Python
一款纯css3实现的动画加载导航
2014/10/08 HTML / CSS
日本卡普空电视游戏软件公司官方购物网站:e-CAPCOM
2018/07/17 全球购物
澳大利亚先进的皮肤和激光诊所购物网站:Soho Skincare
2018/10/15 全球购物
大专应届生个人的自我评价
2013/11/21 职场文书
上课说话检讨书大全
2014/01/22 职场文书
社区道德讲堂实施方案
2014/03/21 职场文书
国际贸易系求职信
2014/08/09 职场文书
代理人委托书
2014/09/16 职场文书
2014年图书管理员工作总结
2014/12/01 职场文书
商超业务员岗位职责
2015/02/13 职场文书
SpringBoot+VUE实现数据表格的实战
2021/08/02 Java/Android