Python爬虫:通过关键字爬取百度图片


Posted in Python onFebruary 17, 2017

使用工具:Python2.7 点我下载

scrapy框架

sublime text3

一。搭建python(Windows版本)

 1.安装python2.7 ---然后在cmd当中输入python,界面如下则安装成功

Python爬虫:通过关键字爬取百度图片

 2.集成Scrapy框架----输入命令行:pip install Scrapy

Python爬虫:通过关键字爬取百度图片

安装成功界面如下:

Python爬虫:通过关键字爬取百度图片

失败的情况很多,举例一种:

Python爬虫:通过关键字爬取百度图片

解决方案:

其余错误可百度搜索。

二。开始编程。

1.爬取无反爬虫措施的静态网站。例如百度贴吧,豆瓣读书。

例如-《桌面吧》的一个帖子https://tieba.baidu.com/p/2460150866?red_tag=3569129009

python代码如下:

Python爬虫:通过关键字爬取百度图片

代码注释:引入了两个模块urllib,re。定义两个函数,第一个函数是获取整个目标网页数据,第二个函数是在目标网页中获取目标图片,遍历网页,并且给获取的图片按照0开始排序。

注:re模块知识点:

Python爬虫:通过关键字爬取百度图片

爬取图片效果图:

Python爬虫:通过关键字爬取百度图片

图片保存路径默认在建立的.py同目录文件下。

2.爬取有反爬虫措施的百度图片。如百度图片等。

例如关键字搜索“表情包”https://image.baidu.com/search/index?tn=baiduimage&ct=201326592&lm=-1&cl=2&ie=gbk&word=%B1%ED%C7%E9%B0%FC&fr=ala&ori_query=%E8%A1%A8%E6%83%85%E5%8C%85&ala=0&alatpl=sp&pos=0&hs=2&xthttps=111111

图片采用滚动式加载,先爬取最优先的30张。

代码如下:

Python爬虫:通过关键字爬取百度图片

代码注释:导入4个模块,os模块用于指定保存路径。前两个函数同上。第三个函数使用了if语句,并tryException异常。

爬取过程如下:

Python爬虫:通过关键字爬取百度图片

爬取结果:

Python爬虫:通过关键字爬取百度图片

注:编写python代码注重对齐,and不能混用Tab和空格,易报错。

以上就是本文的全部内容,希望本文的内容对大家的学习或者工作能带来一定的帮助,同时也希望多多支持三水点靠木!

Python 相关文章推荐
python基于urllib实现按照百度音乐分类下载mp3的方法
May 25 Python
简单谈谈Python中的闭包
Nov 30 Python
Python 正则表达式的高级用法
Dec 04 Python
利用python程序帮大家清理windows垃圾
Jan 15 Python
Python实现统计代码行的方法分析
Jul 12 Python
Python UnboundLocalError和NameError错误根源案例解析
Oct 31 Python
python读取txt文件中特定位置字符的方法
Dec 24 Python
Django框架登录加上验证码校验实现验证功能示例
May 23 Python
关于Python形参打包与解包小技巧分享
Aug 24 Python
python 解决flask uwsgi 获取不到全局变量的问题
Dec 22 Python
pycharm下pyqt4安装及环境配置的教程
Apr 24 Python
如何用python识别滑块验证码中的缺口
Apr 01 Python
Python 遍历列表里面序号和值的方法(三种)
Feb 17 #Python
浅谈python中的实例方法、类方法和静态方法
Feb 17 #Python
Python之日期与时间处理模块(date和datetime)
Feb 16 #Python
python字符串中的单双引
Feb 16 #Python
使用PyV8在Python爬虫中执行js代码
Feb 16 #Python
Python错误提示:[Errno 24] Too many open files的分析与解决
Feb 16 #Python
Python变量和数据类型详解
Feb 15 #Python
You might like
如何使用脚本模仿登陆过程
2006/11/22 PHP
php实现把数组按指定的个数分隔
2014/02/17 PHP
PHP集成百度Ueditor 1.4.3
2014/11/23 PHP
php实现将字符串按照指定距离进行分割的方法
2015/03/14 PHP
CodeIgniter配置之database.php用法实例分析
2016/01/20 PHP
PHP基于PDO实现的SQLite操作类【包含增删改查及事务等操作】
2017/06/21 PHP
Laravel中七个非常有用但很少人知道的Carbon方法
2017/09/21 PHP
PHP获取数组中指定的一列实例
2017/12/27 PHP
vmware linux系统安装最新的php7图解
2019/04/14 PHP
在Laravel 的 Blade 模版中实现定义变量
2019/10/14 PHP
点击广告后才能获得下载地址
2006/10/26 Javascript
JavaScript自执行闭包的小例子
2013/06/29 Javascript
js 数组操作之pop,push,unshift,splice,shift
2014/01/29 Javascript
jquery带有索引按钮且自动轮播切换特效代码分享
2015/09/15 Javascript
sso跨域写cookie的一段js脚本(推荐)
2016/05/25 Javascript
Javascript 函数的四种调用模式
2016/11/05 Javascript
nodejs基础应用
2017/02/03 NodeJs
angular4中引入echarts的方法示例
2019/01/29 Javascript
浅谈JavaScript窗体Window.ShowModalDialog使用
2020/07/22 Javascript
[42:20]Secret vs Liquid 2019国际邀请赛小组赛 BO2 第二场 8.15
2019/08/17 DOTA
简单谈谈python的反射机制
2016/06/28 Python
pip安装时ReadTimeoutError的解决方法
2018/06/12 Python
Python实现查找字符串数组最长公共前缀示例
2019/03/27 Python
解决Django中修改js css文件但浏览器无法及时与之改变的问题
2019/08/31 Python
Flask项目中实现短信验证码和邮箱验证码功能
2019/12/05 Python
django模板获取list中指定索引的值方式
2020/05/14 Python
Python3 webservice接口测试代码详解
2020/06/23 Python
美国室内和室外装饰花盆购物网站:ePlanters
2019/03/22 全球购物
人事助理岗位职责
2013/11/18 职场文书
入党申请人的自我鉴定
2013/12/01 职场文书
自我评价的写作规则
2014/01/06 职场文书
元旦联欢会感言
2014/03/04 职场文书
活动总结格式范文
2014/04/26 职场文书
2015年见习期个人工作总结
2015/05/28 职场文书
windows下快速安装nginx并配置开机自启动的方法
2021/05/11 Servers
TensorFlow中tf.batch_matmul()的用法
2021/06/02 Python