PHP实现爬虫爬取图片代码实例


Posted in PHP onMarch 03, 2021

文字信息

我们尝试获取表的信息,这里,我们就用某校的课表来代替: 

PHP实现爬虫爬取图片代码实例 

接下来我们就上代码:

a.php

<?php  
header( "Content-type:text/html;Charset=utf-8" );
$ch = curl_init();
$url ="表的链接";
curl_setopt ( $ch , CURLOPT_USERAGENT ,"Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/53.0.2785.113 Safari/537.36" );
curl_setopt($ch,CURLOPT_URL,$url);
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
$content=curl_exec($ch);
preg_match_all("/<td rowspan=\"\d\">(.*?)<\/td>\n<td rowspan=\"\d\">(.*?)<\/td><td rowspan=\"\d\" align=\"\w+\">(.*?)<\/td><td rowspan=\"\d\" align=\"\w+\">(.*?)<\/td><td>(.*?)<\/td>\n<td>(.*?)<\/td><td>(.*?)<\/td>/",$content,$matchs,PREG_SET_ORDER);
//匹配该表所用的正则
var_dump($matchs);

然后咱们就运行一下: 

PHP实现爬虫爬取图片代码实例

成功获取到课表;

图片获取

绝对链接

我们以百度图库的首页为例 

PHP实现爬虫爬取图片代码实例

b.php

<?php 
header( "Content-type:text/html;Charset=utf-8" );
$ch = curl_init();
$url="http://image.baidu.com/";
curl_setopt ($ch , CURLOPT_USERAGENT ,"Mozilla/5.0 (Windows NT 10.0; Win64; x64)AppleWebKit/537.36 (KHTML, like Gecko) Chrome/53.0.2785.113 Safari/537.36" );
curl_setopt($ch,CURLOPT_URL,$url);
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
$content=curl_exec($ch);
$string=file_get_contents($url);
preg_match_all("/<img([^>]*)\s*src=('|\")([^'\"]+)('|\")/", $string,$matches);
$new_arr=array_unique($matches[3]);
foreach($new_arr as $key) {
	echo "<img src=$key>";
}

然后,我们就获得了下面的页面: 

PHP实现爬虫爬取图片代码实例

相对链接

百度图库的图片的链接大部分是绝对链接,那么当我们遇到网页图片为相对链接的时候,我们该怎么处理呢?其实很简单,我们只需要将循环那部分改为 

PHP实现爬虫爬取图片代码实例 

那么我们就可以同样在浏览器中输出图片了;

到此这篇关于PHP实现爬虫爬取图片代码实例的文章就介绍到这了,更多相关PHP实现爬虫内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

PHP 相关文章推荐
一段防盗连的PHP代码
Dec 06 PHP
PHP中删除变量时unset()和null的区别分析
Jan 27 PHP
PHP 杂谈《重构-改善既有代码的设计》之四 简化条件表达式
Apr 09 PHP
使用PHP实现Mysql读写分离
Jun 28 PHP
php按百分比生成缩略图的代码分享
May 10 PHP
PHP 获取ip地址代码汇总
Jul 05 PHP
thinkphp项目部署到Linux服务器上报错“模板不存在”如何解决
Apr 27 PHP
PHP实现的网站目录扫描索引工具
Sep 08 PHP
PHP面向对象程序设计之命名空间与自动加载类详解
Dec 02 PHP
php的PDO事务处理机制实例分析
Feb 16 PHP
PHP操作MySQL中BLOB字段的方法示例【存储文本与图片】
Sep 15 PHP
PHP7匿名类的用法示例
Apr 05 PHP
PHP执行系统命令函数实例讲解
Mar 03 #PHP
Git命令之分支详解
Mar 02 #PHP
PHP之header函数详解
Mar 02 #PHP
laravel与thinkphp之间的区别与优缺点
Mar 02 #PHP
php中array_fill函数的实例用法
Mar 02 #PHP
PHP网站常见安全漏洞,及相应防范措施总结
Mar 01 #PHP
php框架知识点的整理和补充
Mar 01 #PHP
You might like
虫族 Zerg 热键控制
2020/03/14 星际争霸
PHP 字符串分割和比较
2009/10/06 PHP
解析PHP获取当前网址及域名的实现代码
2013/06/23 PHP
PHP动态页生成静态页的3种常用方法
2014/11/13 PHP
php正则preg_replace_callback函数用法实例
2015/06/01 PHP
在Windows上安装Node.js模块的方法
2011/09/25 Javascript
Jquery 点击按钮自动高亮实现原理及代码
2014/04/25 Javascript
jQuery 计算iframe 窗口大小的方法
2014/05/13 Javascript
json传值以及ajax接收详解
2016/05/24 Javascript
JavaScript对象创建模式实例汇总
2016/10/03 Javascript
基于Javascript实现的不重复ID的生成器
2016/12/25 Javascript
利用jQuery实现一个简单的表格上下翻页效果
2017/03/14 Javascript
详解NODEJS的http实现
2018/01/04 NodeJs
Servlet3.0与纯javascript通过Ajax交互的实例详解
2018/03/18 Javascript
微信小程序实现图片滚动效果示例
2018/12/05 Javascript
微信小程序仿通讯录功能
2020/04/09 Javascript
Vue如何基于es6导入外部js文件
2020/05/15 Javascript
用Python生成器实现微线程编程的教程
2015/04/13 Python
详谈python read readline readlines的区别
2017/09/22 Python
python多任务之协程的使用详解
2019/08/26 Python
解决django后台管理界面添加中文内容乱码问题
2019/11/15 Python
python opencv进行图像拼接
2020/03/27 Python
Python安装第三方库攻略(pip和Anaconda)
2020/10/15 Python
Pycharm安装Qt Design快捷工具的详细教程
2020/11/18 Python
美国经典刺绣和字母儿童服装特卖:Smocked Auctions
2018/07/16 全球购物
大课间活动实施方案
2014/03/06 职场文书
股份合作协议书范本
2014/04/14 职场文书
《永远的白衣战士》教学反思
2014/04/25 职场文书
我爱读书演讲稿
2014/05/07 职场文书
支行行长竞聘演讲稿
2014/05/15 职场文书
开工仪式策划方案
2014/05/23 职场文书
影视后期实训报告
2014/11/05 职场文书
2016年暑期见闻作文
2015/11/25 职场文书
如何用threejs实现实时多边形折射
2021/05/07 Javascript
教你怎么用Python实现GIF动图的提取及合成
2021/06/15 Python
Python的property属性详细讲解
2022/04/11 Python