Python爬虫:通过关键字爬取百度图片


Posted in Python onFebruary 17, 2017

使用工具:Python2.7 点我下载

scrapy框架

sublime text3

一。搭建python(Windows版本)

 1.安装python2.7 ---然后在cmd当中输入python,界面如下则安装成功

Python爬虫:通过关键字爬取百度图片

 2.集成Scrapy框架----输入命令行:pip install Scrapy

Python爬虫:通过关键字爬取百度图片

安装成功界面如下:

Python爬虫:通过关键字爬取百度图片

失败的情况很多,举例一种:

Python爬虫:通过关键字爬取百度图片

解决方案:

其余错误可百度搜索。

二。开始编程。

1.爬取无反爬虫措施的静态网站。例如百度贴吧,豆瓣读书。

例如-《桌面吧》的一个帖子https://tieba.baidu.com/p/2460150866?red_tag=3569129009

python代码如下:

Python爬虫:通过关键字爬取百度图片

代码注释:引入了两个模块urllib,re。定义两个函数,第一个函数是获取整个目标网页数据,第二个函数是在目标网页中获取目标图片,遍历网页,并且给获取的图片按照0开始排序。

注:re模块知识点:

Python爬虫:通过关键字爬取百度图片

爬取图片效果图:

Python爬虫:通过关键字爬取百度图片

图片保存路径默认在建立的.py同目录文件下。

2.爬取有反爬虫措施的百度图片。如百度图片等。

例如关键字搜索“表情包”https://image.baidu.com/search/index?tn=baiduimage&ct=201326592&lm=-1&cl=2&ie=gbk&word=%B1%ED%C7%E9%B0%FC&fr=ala&ori_query=%E8%A1%A8%E6%83%85%E5%8C%85&ala=0&alatpl=sp&pos=0&hs=2&xthttps=111111

图片采用滚动式加载,先爬取最优先的30张。

代码如下:

Python爬虫:通过关键字爬取百度图片

代码注释:导入4个模块,os模块用于指定保存路径。前两个函数同上。第三个函数使用了if语句,并tryException异常。

爬取过程如下:

Python爬虫:通过关键字爬取百度图片

爬取结果:

Python爬虫:通过关键字爬取百度图片

注:编写python代码注重对齐,and不能混用Tab和空格,易报错。

以上就是本文的全部内容,希望本文的内容对大家的学习或者工作能带来一定的帮助,同时也希望多多支持三水点靠木!

Python 相关文章推荐
Scrapy-redis爬虫分布式爬取的分析和实现
Feb 07 Python
Python实现在线音乐播放器
Mar 03 Python
Python面向对象特殊成员
Apr 24 Python
Python 逐行分割大txt文件的方法
Oct 10 Python
python计算两个数的百分比方法
Jun 29 Python
Python实现多线程的两种方式分析
Aug 29 Python
详解Django的model查询操作与查询性能优化
Oct 16 Python
对numpy中数组转置的求解以及向量内积计算方法
Oct 31 Python
python神经网络编程实现手写数字识别
May 27 Python
零基础学Python之前需要学c语言吗
Jul 21 Python
Python实现爬取网页中动态加载的数据
Aug 17 Python
分享unittest单元测试框架中几种常用的用例加载方法
Dec 02 Python
Python 遍历列表里面序号和值的方法(三种)
Feb 17 #Python
浅谈python中的实例方法、类方法和静态方法
Feb 17 #Python
Python之日期与时间处理模块(date和datetime)
Feb 16 #Python
python字符串中的单双引
Feb 16 #Python
使用PyV8在Python爬虫中执行js代码
Feb 16 #Python
Python错误提示:[Errno 24] Too many open files的分析与解决
Feb 16 #Python
Python变量和数据类型详解
Feb 15 #Python
You might like
php header()函数使用说明
2008/07/10 PHP
PHP 学习路线与时间表
2010/02/21 PHP
解析PHP中如何将数组变量写入文件
2013/06/06 PHP
Yii框架数据模型的验证规则rules()被执行的方法
2016/12/02 PHP
模仿JQuery.extend函数扩展自己对象的js代码
2009/12/09 Javascript
js 页面传参数时 参数值含特殊字符的问题
2009/12/13 Javascript
js跑马灯代码(自写)
2013/04/17 Javascript
分享JavaScript获取网页关闭与取消关闭的事件
2013/12/13 Javascript
jQuery的text()方法用法分析
2014/12/20 Javascript
学习JavaScript事件流和事件处理程序
2016/01/25 Javascript
Javascript随机标签云代码实例
2016/06/21 Javascript
微信公众平台开发教程(五)详解自定义菜单
2016/12/02 Javascript
详解jQuery uploadify文件上传插件的使用方法
2016/12/16 Javascript
create-react-app修改为多页面支持的方法
2018/05/17 Javascript
jquery层次选择器的介绍
2019/01/18 jQuery
js中火星坐标、百度坐标、WGS84坐标转换实现方法示例
2020/03/02 Javascript
JS删除对象中某一属性案例详解
2020/09/08 Javascript
Python学习笔记整理3之输入输出、python eval函数
2015/12/14 Python
使用Python写一个小游戏
2018/04/02 Python
Windows下PyCharm安装图文教程
2018/08/27 Python
Python3.5实现的三级菜单功能示例
2019/03/25 Python
Python装饰器限制函数运行时间超时则退出执行
2019/04/09 Python
Python 日志logging模块用法简单示例
2019/10/18 Python
HTML5实现移动端点击翻牌功能
2020/10/23 HTML / CSS
英国最大的经认证的有机超市:Planet Organic
2018/02/02 全球购物
澳大利亚宠物食品和药物在线:Jumbo Pets
2018/03/24 全球购物
俄罗斯在线购买飞机票、火车票、巴士票网站:Tutu.ru
2020/03/16 全球购物
积极分子思想汇报
2014/01/04 职场文书
社区母亲节活动方案
2014/03/05 职场文书
班主任个人工作反思
2014/04/28 职场文书
本科生导师推荐信范文
2014/05/18 职场文书
创建绿色学校先进个人材料
2014/08/20 职场文书
庆国庆国旗下讲话稿2014
2014/09/21 职场文书
带刀到教室的检讨书
2014/10/04 职场文书
后进生评语大全
2015/01/04 职场文书
好员工观后感
2015/06/17 职场文书