PHP抓取网页、解析HTML常用的方法总结


Posted in PHP onJuly 01, 2015

概述

爬虫是我们在做程序时经常会遇到的一种功能。PHP有许多开源的爬虫工具,如snoopy,这些开源的爬虫工具,通常能帮我们完成大部分功能,但是在某种情况下,我们需要自己实现一个爬虫,本篇文章对PHP实现爬虫的方式做个总结。

PHP实现爬虫主要方法

1.file()函数
2.file_get_contents()函数
3.fopen()->fread()->fclose()方式
4.curl方式
5.fsockopen()函数,socket方式
6.使用开源工具,如:snoopy

PHP解析XML或HTML主要方式

1.正则表达式
2.PHP DOMDocument对象
3.插件,如:PHP Simple HTML DOM Parser

总结

这里对PHP实现爬虫的方式做个简单得总结,本篇设计到得内容还有很多,稍后会对PHP解析HTML和XML的方式做个总结。

PHP 相关文章推荐
在线竞拍系统的PHP实现框架(二)
Oct 09 PHP
PHP 操作文件的一些FAQ总结
Feb 12 PHP
PHP 程序员的调试技术小结
Nov 15 PHP
PHP中10个不常见却非常有用的函数
Mar 21 PHP
php配合jquery实现增删操作具体实例
Dec 12 PHP
PHP mail()函数使用及配置方法
Jan 14 PHP
一个图片地址分解程序(用于PHP小偷程序)
Aug 23 PHP
php函数与传递参数实例分析
Nov 15 PHP
php通过baihui网API实现读取word文档并展示
Jun 22 PHP
php数据访问之查询关键字
May 09 PHP
PHP中通过getopt解析GNU C风格命令行选项
Nov 18 PHP
深入理解PHP+Mysql分布式事务与解决方案
Dec 03 PHP
PHP中static关键字以及与self关键字的区别
Jul 01 #PHP
PHP单例模式详细介绍
Jul 01 #PHP
curl和libcurl的区别简介
Jul 01 #PHP
PHP+Ajax实时自动检测是否联网的方法
Jul 01 #PHP
PHP超全局数组(Superglobals)介绍
Jul 01 #PHP
PHP中的类型提示(type hinting)功能介绍
Jul 01 #PHP
7个鲜为人知却非常实用的PHP函数
Jul 01 #PHP
You might like
php去除数组中重复数据
2014/11/18 PHP
PHP convert_cyr_string()函数讲解
2019/02/13 PHP
PHP实现批量修改文件名的方法示例
2019/09/18 PHP
PHP迭代器和生成器用法实例分析
2019/09/28 PHP
laravel框架select2多选插件初始化默认选中项操作示例
2020/02/18 PHP
Javascript 页面模板化很多人没有使用过的方法
2012/06/05 Javascript
js与运算符和或运算符的妙用
2014/02/14 Javascript
JS实现弹出浮动窗口(支持鼠标拖动和关闭)实例详解
2015/08/06 Javascript
js实现适用于素材网站的黑色多级菜单导航条效果
2015/08/24 Javascript
jquery解析json格式数据的方法(对象、字符串)
2015/11/24 Javascript
jQuery+PHP+MySQL实现无限级联下拉框效果
2016/02/19 Javascript
jQuery插件JWPlayer视频播放器用法实例分析
2017/01/11 Javascript
使用vue.js2.0 + ElementUI开发后台管理系统详细教程(二)
2017/01/21 Javascript
整理关于Bootstrap导航的慕课笔记
2017/03/29 Javascript
利用js查找数组中指定元素并返回该元素的所有索引示例
2017/03/29 Javascript
JavaScript使用Ajax上传文件的示例代码
2017/08/10 Javascript
回调函数的意义以及python实现实例
2017/06/20 Python
python简易远程控制单线程版
2018/06/20 Python
举例讲解Python常用模块
2019/03/08 Python
Django框架登录加上验证码校验实现验证功能示例
2019/05/23 Python
python 列表输出重复值以及对应的角标方法
2019/06/11 Python
基于python调用psutil模块过程解析
2019/12/20 Python
详解Python直接赋值,深拷贝和浅拷贝
2020/07/09 Python
搭建pypi私有仓库实现过程详解
2020/11/25 Python
使用 CSS3 中@media 实现网页自适应的示例代码
2020/03/24 HTML / CSS
使用phonegap播放音频的实现方法
2017/03/31 HTML / CSS
梅西酒窖:Macy’s Wine Cellar
2018/01/07 全球购物
意大利折扣和优惠券网站:Groupalia
2019/10/09 全球购物
外贸学院会计专业应届生求职信
2013/11/14 职场文书
就业自荐信
2013/12/04 职场文书
生产部岗位职责范文
2014/02/07 职场文书
《猴子种果树》教学反思
2014/04/26 职场文书
作风年建设汇报材料
2014/08/14 职场文书
2016春季幼儿园开学寄语
2015/12/03 职场文书
如何做好工作总结!
2019/04/10 职场文书
测量JavaScript函数的性能各种方式对比
2021/04/27 Javascript