PHP实现爬虫爬取图片代码实例


Posted in PHP onMarch 03, 2021

文字信息

我们尝试获取表的信息,这里,我们就用某校的课表来代替: 

PHP实现爬虫爬取图片代码实例 

接下来我们就上代码:

a.php

<?php  
header( "Content-type:text/html;Charset=utf-8" );
$ch = curl_init();
$url ="表的链接";
curl_setopt ( $ch , CURLOPT_USERAGENT ,"Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/53.0.2785.113 Safari/537.36" );
curl_setopt($ch,CURLOPT_URL,$url);
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
$content=curl_exec($ch);
preg_match_all("/<td rowspan=\"\d\">(.*?)<\/td>\n<td rowspan=\"\d\">(.*?)<\/td><td rowspan=\"\d\" align=\"\w+\">(.*?)<\/td><td rowspan=\"\d\" align=\"\w+\">(.*?)<\/td><td>(.*?)<\/td>\n<td>(.*?)<\/td><td>(.*?)<\/td>/",$content,$matchs,PREG_SET_ORDER);
//匹配该表所用的正则
var_dump($matchs);

然后咱们就运行一下: 

PHP实现爬虫爬取图片代码实例

成功获取到课表;

图片获取

绝对链接

我们以百度图库的首页为例 

PHP实现爬虫爬取图片代码实例

b.php

<?php 
header( "Content-type:text/html;Charset=utf-8" );
$ch = curl_init();
$url="http://image.baidu.com/";
curl_setopt ($ch , CURLOPT_USERAGENT ,"Mozilla/5.0 (Windows NT 10.0; Win64; x64)AppleWebKit/537.36 (KHTML, like Gecko) Chrome/53.0.2785.113 Safari/537.36" );
curl_setopt($ch,CURLOPT_URL,$url);
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
$content=curl_exec($ch);
$string=file_get_contents($url);
preg_match_all("/<img([^>]*)\s*src=('|\")([^'\"]+)('|\")/", $string,$matches);
$new_arr=array_unique($matches[3]);
foreach($new_arr as $key) {
	echo "<img src=$key>";
}

然后,我们就获得了下面的页面: 

PHP实现爬虫爬取图片代码实例

相对链接

百度图库的图片的链接大部分是绝对链接,那么当我们遇到网页图片为相对链接的时候,我们该怎么处理呢?其实很简单,我们只需要将循环那部分改为 

PHP实现爬虫爬取图片代码实例 

那么我们就可以同样在浏览器中输出图片了;

到此这篇关于PHP实现爬虫爬取图片代码实例的文章就介绍到这了,更多相关PHP实现爬虫内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

PHP 相关文章推荐
PHP初学者头疼问题总结
Jul 08 PHP
透析PHP的配置文件php.ini
Oct 09 PHP
利用PHP动态生成VRML网页
Oct 09 PHP
收藏的PHP常用函数 推荐收藏保存
Feb 21 PHP
解决PHP mysql_query执行超时(Fatal error: Maximum execution time …)
Jul 03 PHP
destoon二次开发入门示例
Jun 20 PHP
PHP以mysqli方式连接类完整代码实例
Jul 15 PHP
PHP处理JSON字符串key缺少双引号的解决方法
Sep 16 PHP
php使用ftp远程上传文件类(完美解决主从文件同步问题的方法)
Sep 23 PHP
PHP7新增运算符用法实例分析
Sep 26 PHP
Yii2框架加载css和js文件的方法分析
May 25 PHP
PHP+redis实现的限制抢购防止商品超发功能详解
Sep 19 PHP
PHP执行系统命令函数实例讲解
Mar 03 #PHP
Git命令之分支详解
Mar 02 #PHP
PHP之header函数详解
Mar 02 #PHP
laravel与thinkphp之间的区别与优缺点
Mar 02 #PHP
php中array_fill函数的实例用法
Mar 02 #PHP
PHP网站常见安全漏洞,及相应防范措施总结
Mar 01 #PHP
php框架知识点的整理和补充
Mar 01 #PHP
You might like
详细介绍PHP应用提速面面观
2006/10/09 PHP
PHP中对用户身份认证实现两种方法
2011/06/04 PHP
php过滤HTML标签、属性等正则表达式汇总
2014/09/22 PHP
PHP保存带BOM文件的方法
2015/02/12 PHP
laravel csrf排除路由,禁止,关闭指定路由的例子
2019/10/21 PHP
轻松创建nodejs服务器(10):处理上传图片
2014/12/18 NodeJs
JavaSciprt中处理字符串之sup()方法的使用教程
2015/06/08 Javascript
JS模拟Dialog弹出浮动框效果代码
2015/10/16 Javascript
深入解析jQuery中Deferred的deferred.promise()方法
2016/05/03 Javascript
ionic组件ion-tabs选项卡切换效果实例
2016/08/27 Javascript
JS基于面向对象实现的选项卡效果示例
2016/12/20 Javascript
angular+bootstrap的双向数据绑定实例
2017/03/03 Javascript
ES6学习教程之块级作用域详解
2017/10/09 Javascript
vue的传参方式汇总和router使用技巧
2018/05/22 Javascript
JS简单判断是否在微信浏览器打开的方法示例
2019/01/08 Javascript
详解微信小程序自定义组件的实现及数据交互
2019/07/22 Javascript
在layui下对元素进行事件绑定的实例
2019/09/06 Javascript
Ant Design的可编辑Tree的实现操作
2020/10/31 Javascript
python使用7z解压apk包的方法
2015/04/18 Python
python对数组进行反转的方法
2015/05/20 Python
查看TensorFlow checkpoint文件中的变量名和对应值方法
2018/06/14 Python
三步实现Django Paginator分页的方法
2019/06/11 Python
python简单区块链模拟详解
2019/07/03 Python
python3实现弹弹球小游戏
2019/11/25 Python
Python使用扩展库pywin32实现批量文档打印实例
2020/04/09 Python
日本最佳原创设计品牌:Felissimo(芬理希梦)
2019/03/19 全球购物
英国买鞋网站:Charles Clinkard
2019/11/14 全球购物
荷兰家电购物网站:Expert.nl
2020/01/18 全球购物
化工工艺专业求职信
2013/09/22 职场文书
个人欠款担保书
2014/05/20 职场文书
工程售后服务承诺书
2014/05/21 职场文书
机械工程及其自动化专业求职信
2014/08/08 职场文书
优秀团支部申报材料
2014/12/26 职场文书
2015年销售助理工作总结
2015/05/11 职场文书
巴黎圣母院观后感
2015/06/10 职场文书
C3 线性化算法与 MRO之Python中的多继承
2021/10/05 Python