PHP实现爬虫爬取图片代码实例


Posted in PHP onMarch 03, 2021

文字信息

我们尝试获取表的信息,这里,我们就用某校的课表来代替: 

PHP实现爬虫爬取图片代码实例 

接下来我们就上代码:

a.php

<?php  
header( "Content-type:text/html;Charset=utf-8" );
$ch = curl_init();
$url ="表的链接";
curl_setopt ( $ch , CURLOPT_USERAGENT ,"Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/53.0.2785.113 Safari/537.36" );
curl_setopt($ch,CURLOPT_URL,$url);
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
$content=curl_exec($ch);
preg_match_all("/<td rowspan=\"\d\">(.*?)<\/td>\n<td rowspan=\"\d\">(.*?)<\/td><td rowspan=\"\d\" align=\"\w+\">(.*?)<\/td><td rowspan=\"\d\" align=\"\w+\">(.*?)<\/td><td>(.*?)<\/td>\n<td>(.*?)<\/td><td>(.*?)<\/td>/",$content,$matchs,PREG_SET_ORDER);
//匹配该表所用的正则
var_dump($matchs);

然后咱们就运行一下: 

PHP实现爬虫爬取图片代码实例

成功获取到课表;

图片获取

绝对链接

我们以百度图库的首页为例 

PHP实现爬虫爬取图片代码实例

b.php

<?php 
header( "Content-type:text/html;Charset=utf-8" );
$ch = curl_init();
$url="http://image.baidu.com/";
curl_setopt ($ch , CURLOPT_USERAGENT ,"Mozilla/5.0 (Windows NT 10.0; Win64; x64)AppleWebKit/537.36 (KHTML, like Gecko) Chrome/53.0.2785.113 Safari/537.36" );
curl_setopt($ch,CURLOPT_URL,$url);
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
$content=curl_exec($ch);
$string=file_get_contents($url);
preg_match_all("/<img([^>]*)\s*src=('|\")([^'\"]+)('|\")/", $string,$matches);
$new_arr=array_unique($matches[3]);
foreach($new_arr as $key) {
	echo "<img src=$key>";
}

然后,我们就获得了下面的页面: 

PHP实现爬虫爬取图片代码实例

相对链接

百度图库的图片的链接大部分是绝对链接,那么当我们遇到网页图片为相对链接的时候,我们该怎么处理呢?其实很简单,我们只需要将循环那部分改为 

PHP实现爬虫爬取图片代码实例 

那么我们就可以同样在浏览器中输出图片了;

到此这篇关于PHP实现爬虫爬取图片代码实例的文章就介绍到这了,更多相关PHP实现爬虫内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

PHP 相关文章推荐
PHP4引用文件语句的对比
Oct 09 PHP
php简单浏览目录内容的实现代码
Jun 07 PHP
php+mysql大量用户登录解决方案分析
Dec 29 PHP
php 使用array函数实现分页
Feb 13 PHP
PHP使用DirectoryIterator显示下拉文件列表的方法
Mar 13 PHP
Symfony2在Nginx下的配置方法图文教程
Feb 04 PHP
PHP编写学校网站上新生注册登陆程序的实例分享
Mar 21 PHP
PHP+Ajax 检测网络是否正常实例详解
Dec 16 PHP
[原创]PHP正则删除html代码中a标签并保留标签内容的方法
May 23 PHP
Laravel使用PHPQRCODE实现生成带有LOGO的二维码图片功能示例
Jul 07 PHP
Thinkphp5结合layer弹窗定制操作结果页面
Jul 07 PHP
PHP执行linux命令6个函数代码实例
Nov 24 PHP
PHP执行系统命令函数实例讲解
Mar 03 #PHP
Git命令之分支详解
Mar 02 #PHP
PHP之header函数详解
Mar 02 #PHP
laravel与thinkphp之间的区别与优缺点
Mar 02 #PHP
php中array_fill函数的实例用法
Mar 02 #PHP
PHP网站常见安全漏洞,及相应防范措施总结
Mar 01 #PHP
php框架知识点的整理和补充
Mar 01 #PHP
You might like
如何跨站抓取别的站点的页面的补充
2006/10/09 PHP
用PHP的ob_start() 控制您的浏览器cache
2009/08/03 PHP
windows下开发并编译PHP扩展的方法
2011/03/18 PHP
Zend的MVC机制使用分析(一)
2013/05/02 PHP
使用迭代器 遍历文件信息的详解
2013/06/08 PHP
PHP常量使用的几个需要注意的地方(谨慎使用PHP中的常量)
2014/09/12 PHP
源码分析 Laravel 重复执行同一个队列任务的原因
2017/12/25 PHP
PHP PDOStatement::nextRowset讲解
2019/02/01 PHP
google地图的路线实现代码
2009/08/20 Javascript
javascript tips提示框组件实现代码
2010/11/19 Javascript
jQuery焦点图切换特效插件封装实例
2013/08/18 Javascript
js判断iframe内的网页是否滚动到底部触发事件
2014/03/18 Javascript
javascript实现window.print()去除页眉页脚
2014/12/30 Javascript
JavaScript中实现map功能代码分享
2015/06/11 Javascript
深入学习JavaScript中的Rest参数和参数默认值
2015/07/28 Javascript
ztree获取选中节点时不能进入可视区域出现BUG如何解决
2015/12/03 Javascript
JS实现图片平面旋转的方法
2016/03/01 Javascript
去除字符串左右两边的空格(实现代码)
2016/05/12 Javascript
jQuery CSS3自定义美化Checkbox实现代码
2016/05/12 Javascript
使用BootStrap建立响应式网页——通栏轮播图(carousel)
2016/12/21 Javascript
使用jQuery实现鼠标点击左右按钮滑动切换
2017/08/04 jQuery
Vue.js 父子组件通信的十种方式
2018/10/30 Javascript
详解可以用在VS Code中的正则表达式小技巧
2019/05/14 Javascript
JS立即执行的匿名函数用法分析
2019/11/04 Javascript
javascript实现贪吃蛇小游戏
2020/07/28 Javascript
PyQt5每天必学之创建窗口居中效果
2018/04/19 Python
python基于property()函数定义属性
2020/01/22 Python
怎样实现H5+CSS3手指滑动切换图片的示例代码
2019/05/05 HTML / CSS
JD Sports意大利:英国篮球和运动时尚的领导者
2017/10/29 全球购物
锐步美国官方网站:Reebok美国
2018/01/10 全球购物
DataReader和DataSet的异同
2014/12/31 面试题
C#笔试题
2015/07/14 面试题
美术毕业生求职信
2014/02/25 职场文书
村级环境卫生整治方案
2014/05/04 职场文书
Python数据清洗工具之Numpy的基本操作
2021/04/22 Python
MySQL数据库实验实现简单数据库应用系统设计
2022/06/21 MySQL