PHP实现爬虫爬取图片代码实例


Posted in PHP onMarch 03, 2021

文字信息

我们尝试获取表的信息,这里,我们就用某校的课表来代替: 

PHP实现爬虫爬取图片代码实例 

接下来我们就上代码:

a.php

<?php  
header( "Content-type:text/html;Charset=utf-8" );
$ch = curl_init();
$url ="表的链接";
curl_setopt ( $ch , CURLOPT_USERAGENT ,"Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/53.0.2785.113 Safari/537.36" );
curl_setopt($ch,CURLOPT_URL,$url);
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
$content=curl_exec($ch);
preg_match_all("/<td rowspan=\"\d\">(.*?)<\/td>\n<td rowspan=\"\d\">(.*?)<\/td><td rowspan=\"\d\" align=\"\w+\">(.*?)<\/td><td rowspan=\"\d\" align=\"\w+\">(.*?)<\/td><td>(.*?)<\/td>\n<td>(.*?)<\/td><td>(.*?)<\/td>/",$content,$matchs,PREG_SET_ORDER);
//匹配该表所用的正则
var_dump($matchs);

然后咱们就运行一下: 

PHP实现爬虫爬取图片代码实例

成功获取到课表;

图片获取

绝对链接

我们以百度图库的首页为例 

PHP实现爬虫爬取图片代码实例

b.php

<?php 
header( "Content-type:text/html;Charset=utf-8" );
$ch = curl_init();
$url="http://image.baidu.com/";
curl_setopt ($ch , CURLOPT_USERAGENT ,"Mozilla/5.0 (Windows NT 10.0; Win64; x64)AppleWebKit/537.36 (KHTML, like Gecko) Chrome/53.0.2785.113 Safari/537.36" );
curl_setopt($ch,CURLOPT_URL,$url);
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
$content=curl_exec($ch);
$string=file_get_contents($url);
preg_match_all("/<img([^>]*)\s*src=('|\")([^'\"]+)('|\")/", $string,$matches);
$new_arr=array_unique($matches[3]);
foreach($new_arr as $key) {
	echo "<img src=$key>";
}

然后,我们就获得了下面的页面: 

PHP实现爬虫爬取图片代码实例

相对链接

百度图库的图片的链接大部分是绝对链接,那么当我们遇到网页图片为相对链接的时候,我们该怎么处理呢?其实很简单,我们只需要将循环那部分改为 

PHP实现爬虫爬取图片代码实例 

那么我们就可以同样在浏览器中输出图片了;

到此这篇关于PHP实现爬虫爬取图片代码实例的文章就介绍到这了,更多相关PHP实现爬虫内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

PHP 相关文章推荐
php5 and xml示例
Nov 22 PHP
php下实现一个阿拉伯数字转中文数字的函数
Jul 10 PHP
php 静态页面中显示动态内容
Aug 14 PHP
php的数组与字符串的转换函数整理汇总
Jul 18 PHP
php调用Google translate_tts api实现代码
Aug 07 PHP
php实现html标签闭合检测与修复方法
Jul 09 PHP
PHP简单实现上一页下一页功能示例
Sep 14 PHP
关于PHP内置的字符串处理函数详解
Feb 04 PHP
php数值转换时间及时间转换数值用法示例
May 18 PHP
PHP有序表查找之插值查找算法示例
Feb 10 PHP
php微信公众号开发之翻页查询
Oct 20 PHP
PHP yield关键字功能与用法分析
Jan 03 PHP
PHP执行系统命令函数实例讲解
Mar 03 #PHP
Git命令之分支详解
Mar 02 #PHP
PHP之header函数详解
Mar 02 #PHP
laravel与thinkphp之间的区别与优缺点
Mar 02 #PHP
php中array_fill函数的实例用法
Mar 02 #PHP
PHP网站常见安全漏洞,及相应防范措施总结
Mar 01 #PHP
php框架知识点的整理和补充
Mar 01 #PHP
You might like
PHP 身份验证方面的函数
2009/10/11 PHP
解析如何屏蔽php中的phpinfo()函数
2013/06/06 PHP
深入array multisort排序原理的详解
2013/06/18 PHP
php获取新浪微博数据API实例
2013/11/12 PHP
php将字符串全部转换成大写或者小写的方法
2015/03/17 PHP
PHP利用pdo_odbc实现连接数据库示例【基于ThinkPHP5.1搭建的项目】
2019/05/13 PHP
多浏览器支持的右下角浮动窗口
2010/04/01 Javascript
JS for循环中i++ 和 ++i的区别介绍
2016/07/20 Javascript
JavaScript中清空数组的方法总结
2016/12/02 Javascript
JS制作类似选项卡切换的年历
2016/12/03 Javascript
jquery中$.fn和图片滚动效果实现的必备知识总结
2017/04/21 jQuery
[04:39]显微镜下的DOTA2第十三期—Pis卡尔个人秀
2014/04/04 DOTA
[56:01]2018DOTA2亚洲邀请赛 3.31 小组赛 B组 Effect vs EG
2018/03/31 DOTA
Python中str.format()详解
2017/03/12 Python
基于DataFrame筛选数据与loc的用法详解
2018/05/18 Python
django项目登录中使用图片验证码的实现方法
2019/08/15 Python
Django url,从一个页面调到另个页面的方法
2019/08/21 Python
Django通过dwebsocket实现websocket的例子
2019/11/15 Python
python list的index()和find()的实现
2020/11/16 Python
韩国著名的在线综合购物网站:Akmall
2016/08/07 全球购物
Myprotein台湾官方网站:全球领先的运动营养品牌
2018/12/10 全球购物
莱德杯高尔夫欧洲官方商店:Ryder Cup Shop
2019/08/14 全球购物
中英文自我评价语句
2013/12/20 职场文书
《燕子专列》教学反思
2014/02/21 职场文书
小学毕业演讲稿
2014/04/25 职场文书
关于奉献的演讲稿
2014/05/21 职场文书
学术诚信承诺书
2014/05/26 职场文书
运动会拉拉队口号
2014/06/09 职场文书
合作经营协议书范本
2014/09/16 职场文书
毕业生班级鉴定评语
2015/01/04 职场文书
党支部审查意见
2015/06/02 职场文书
建筑工程催款函
2015/06/24 职场文书
Mysql基础知识点汇总
2021/05/26 MySQL
Django集成富文本编辑器summernote的实现步骤
2021/05/31 Python
微软团队与 NASA 科学家和惠普企业(HPE)的工程师合作
2022/04/21 数码科技
vue3 自定义图片放大器效果的示例代码
2022/07/23 Vue.js