Python爬虫:通过关键字爬取百度图片


Posted in Python onFebruary 17, 2017

使用工具:Python2.7 点我下载

scrapy框架

sublime text3

一。搭建python(Windows版本)

 1.安装python2.7 ---然后在cmd当中输入python,界面如下则安装成功

Python爬虫:通过关键字爬取百度图片

 2.集成Scrapy框架----输入命令行:pip install Scrapy

Python爬虫:通过关键字爬取百度图片

安装成功界面如下:

Python爬虫:通过关键字爬取百度图片

失败的情况很多,举例一种:

Python爬虫:通过关键字爬取百度图片

解决方案:

其余错误可百度搜索。

二。开始编程。

1.爬取无反爬虫措施的静态网站。例如百度贴吧,豆瓣读书。

例如-《桌面吧》的一个帖子https://tieba.baidu.com/p/2460150866?red_tag=3569129009

python代码如下:

Python爬虫:通过关键字爬取百度图片

代码注释:引入了两个模块urllib,re。定义两个函数,第一个函数是获取整个目标网页数据,第二个函数是在目标网页中获取目标图片,遍历网页,并且给获取的图片按照0开始排序。

注:re模块知识点:

Python爬虫:通过关键字爬取百度图片

爬取图片效果图:

Python爬虫:通过关键字爬取百度图片

图片保存路径默认在建立的.py同目录文件下。

2.爬取有反爬虫措施的百度图片。如百度图片等。

例如关键字搜索“表情包”https://image.baidu.com/search/index?tn=baiduimage&ct=201326592&lm=-1&cl=2&ie=gbk&word=%B1%ED%C7%E9%B0%FC&fr=ala&ori_query=%E8%A1%A8%E6%83%85%E5%8C%85&ala=0&alatpl=sp&pos=0&hs=2&xthttps=111111

图片采用滚动式加载,先爬取最优先的30张。

代码如下:

Python爬虫:通过关键字爬取百度图片

代码注释:导入4个模块,os模块用于指定保存路径。前两个函数同上。第三个函数使用了if语句,并tryException异常。

爬取过程如下:

Python爬虫:通过关键字爬取百度图片

爬取结果:

Python爬虫:通过关键字爬取百度图片

注:编写python代码注重对齐,and不能混用Tab和空格,易报错。

以上就是本文的全部内容,希望本文的内容对大家的学习或者工作能带来一定的帮助,同时也希望多多支持三水点靠木!

Python 相关文章推荐
使用70行Python代码实现一个递归下降解析器的教程
Apr 17 Python
Python中pip安装非PyPI官网第三方库的方法
Jun 02 Python
web.py 十分钟创建简易博客实现代码
Apr 22 Python
python实现字符串连接的三种方法及其效率、适用场景详解
Jan 13 Python
python导出hive数据表的schema实例代码
Jan 22 Python
Python使用Flask-SQLAlchemy连接数据库操作示例
Aug 31 Python
Python中垃圾回收和del语句详解
Nov 15 Python
pytorch 转换矩阵的维数位置方法
Dec 08 Python
从运行效率与开发效率比较Python和C++
Dec 14 Python
原生python实现knn分类算法
Oct 24 Python
python实现信号时域统计特征提取代码
Feb 26 Python
Python的collections模块真的很好用
Mar 01 Python
Python 遍历列表里面序号和值的方法(三种)
Feb 17 #Python
浅谈python中的实例方法、类方法和静态方法
Feb 17 #Python
Python之日期与时间处理模块(date和datetime)
Feb 16 #Python
python字符串中的单双引
Feb 16 #Python
使用PyV8在Python爬虫中执行js代码
Feb 16 #Python
Python错误提示:[Errno 24] Too many open files的分析与解决
Feb 16 #Python
Python变量和数据类型详解
Feb 15 #Python
You might like
WINXP下apache+php4+mysql
2006/11/25 PHP
php array的学习笔记
2012/05/16 PHP
PHP文件大小格式化函数合集
2014/03/10 PHP
使用ob系列函数实现PHP网站页面静态化
2014/08/13 PHP
Thinkphp调用Image类生成缩略图的方法
2015/03/07 PHP
php 自定义函数实现将数据 以excel 表格形式导出示例
2019/11/13 PHP
Laravel5.1 框架Middleware中间件基本用法实例分析
2020/01/04 PHP
Javascript写了一个清除“logo1_.exe”的杀毒工具(可扫描目录)
2007/02/09 Javascript
jQuery formValidator表单验证插件开源了 含API帮助、源码、示例
2008/08/14 Javascript
jquery怎样实现ajax联动框(一)
2013/03/08 Javascript
jquery让返回的内容显示在特定div里(代码少而精悍)
2014/06/23 Javascript
浅析js绑定事件的常用方法
2016/05/15 Javascript
AngularJS监听路由的变化示例代码
2016/09/23 Javascript
Bootstrap的popover(弹出框)2秒后定时消失的实现代码
2017/02/27 Javascript
手写简单的jQuery雪花飘落效果实例
2018/04/22 jQuery
详解Webpack4多页应用打包方案
2020/07/16 Javascript
跟老齐学Python之关于循环的小伎俩
2014/10/02 Python
Python写的英文字符大小写转换代码示例
2015/03/06 Python
使用Python对Csv文件操作实例代码
2017/05/12 Python
Python 3.x读写csv文件中数字的方法示例
2017/08/29 Python
Python 2.x如何设置命令执行的超时时间实例
2017/10/19 Python
Python 200行代码实现一个滑动验证码过程详解
2019/07/11 Python
简单了解Pandas缺失值处理方法
2019/11/16 Python
在OpenCV里实现条码区域识别的方法示例
2019/12/04 Python
python深copy和浅copy区别对比解析
2019/12/26 Python
tensorflow入门:tfrecord 和tf.data.TFRecordDataset的使用
2020/01/20 Python
浅谈Pycharm最有必要改的几个默认设置项
2020/02/14 Python
520使用Python实现“我爱你”表白
2020/05/20 Python
Python爬虫如何破解JS加密的Cookie
2020/11/19 Python
html5中canvas学习笔记1-画板的尺寸与实际显示尺寸
2013/01/06 HTML / CSS
ZINVO手表官网:男士和女士手表
2019/03/10 全球购物
Trench London官方网站:高级风衣和意大利皮夹克
2020/07/11 全球购物
装修五一活动策划案
2014/01/23 职场文书
选秀节目策划方案
2014/06/06 职场文书
追讨欠款律师函
2015/06/24 职场文书
《伯牙绝弦》教学反思
2016/02/16 职场文书