编程 Python

Python爬虫：通过关键字爬取百度图片

Posted in Python onFebruary 17, 2017

使用工具：Python2.7 点我下载

scrapy框架

sublime text3

一。搭建python（Windows版本）

1.安装python2.7 ---然后在cmd当中输入python，界面如下则安装成功

Python爬虫：通过关键字爬取百度图片

2.集成Scrapy框架----输入命令行：pip install Scrapy

Python爬虫：通过关键字爬取百度图片

安装成功界面如下：

Python爬虫：通过关键字爬取百度图片

失败的情况很多，举例一种：

Python爬虫：通过关键字爬取百度图片

解决方案：

其余错误可百度搜索。

二。开始编程。

1.爬取无反爬虫措施的静态网站。例如百度贴吧，豆瓣读书。

例如-《桌面吧》的一个帖子https://tieba.baidu.com/p/2460150866?red_tag=3569129009

python代码如下：

Python爬虫：通过关键字爬取百度图片

代码注释：引入了两个模块urllib,re。定义两个函数，第一个函数是获取整个目标网页数据，第二个函数是在目标网页中获取目标图片，遍历网页，并且给获取的图片按照0开始排序。

注：re模块知识点:

Python爬虫：通过关键字爬取百度图片

爬取图片效果图：

Python爬虫：通过关键字爬取百度图片

图片保存路径默认在建立的.py同目录文件下。

2.爬取有反爬虫措施的百度图片。如百度图片等。

例如关键字搜索“表情包”https://image.baidu.com/search/index?tn=baiduimage&ct=201326592&lm=-1&cl=2&ie=gbk&word=%B1%ED%C7%E9%B0%FC&fr=ala&ori_query=%E8%A1%A8%E6%83%85%E5%8C%85&ala=0&alatpl=sp&pos=0&hs=2&xthttps=111111

图片采用滚动式加载，先爬取最优先的30张。

代码如下：

Python爬虫：通过关键字爬取百度图片

代码注释：导入4个模块，os模块用于指定保存路径。前两个函数同上。第三个函数使用了if语句，并tryException异常。

爬取过程如下：

Python爬虫：通过关键字爬取百度图片

爬取结果：

Python爬虫：通过关键字爬取百度图片

注：编写python代码注重对齐，and不能混用Tab和空格，易报错。

以上就是本文的全部内容，希望本文的内容对大家的学习或者工作能带来一定的帮助，同时也希望多多支持三水点靠木！

Python爬虫：通过关键字爬取百度图片

- Author -

WC-cong

声明：登载此文出于传递更多信息之目的，并不意味着赞同其观点或证实其描述。

Python 相关文章推荐

利用Psyco提升Python运行速度

Dec 24 Python

使用python实现tcp自动重连

Jul 02 Python

Python实现MySQL操作的方法小结【安装,连接,增删改查等】

Jul 12 Python

Python探索之URL Dispatcher实例详解

Oct 28 Python

python 标准差计算的实现（std）

Jul 29 Python

Django choices下拉列表绑定实例

Mar 13 Python

PyCharm 2020 激活到 2100 年的教程

Mar 25 Python

python3中TQDM库安装及使用详解

Nov 18 Python

python可视化分析的实现(matplotlib、seaborn、ggplot2)

Feb 03 Python

python 指定源路径来解决import问题的操作

Mar 04 Python

Python中json.dumps()函数的使用解析

May 17 Python

基于Python实现射击小游戏的制作

Apr 06 Python

Python 遍历列表里面序号和值的方法（三种）

Feb 17 #Python

浅谈python中的实例方法、类方法和静态方法

Feb 17 #Python

Python之日期与时间处理模块（date和datetime）

Feb 16 #Python

python字符串中的单双引

Feb 16 #Python

使用PyV8在Python爬虫中执行js代码

Feb 16 #Python

Python错误提示：[Errno 24] Too many open files的分析与解决

Feb 16 #Python

Python变量和数据类型详解

Feb 15 #Python

You might like

php判断是否为json格式的方法

2014/03/04 PHP

javascript css styleFloat和cssFloat

2010/03/15 Javascript

事件绑定之小测试 onclick && addEventListener

2011/07/31 Javascript

jQuery中:enabled选择器用法实例

2015/01/04 Javascript

JS+CSS实现仿雅虎另类滑动门切换效果

2015/10/13 Javascript

Jquery attr()方法属性赋值和属性获取详解

2016/04/15 Javascript

jQuery简单设置文本框回车事件的方法

2016/08/01 Javascript

JavaScript实现自动切换图片代码

2016/10/11 Javascript

JS正则表达式修饰符global(/g)用法分析

2016/12/27 Javascript

js实现文字无缝向上滚动

2017/02/16 Javascript

Webpack中css-loader和less-loader的使用教程

2017/04/27 Javascript

基于vue2实现左滑删除功能

2017/11/28 Javascript

vue-cli 引入jQuery，Bootstrap，popper的方法

2018/09/03 jQuery

详解Vue中watch的详细用法

2018/11/28 Javascript

vue进入页面时滚动条始终在底部代码实例

2019/03/26 Javascript

Vue实现点击显示再点击隐藏效果(点击页面空白区域也隐藏效果)

2020/01/16 Javascript

Windows下实现Python2和Python3两个版共存的方法

2015/06/12 Python

Python实现爬虫爬取NBA数据功能示例

2018/05/28 Python

Python3实现转换Image图片格式

2018/06/21 Python

tensorflow的计算图总结

2020/01/12 Python

Tensorflow加载Vgg预训练模型操作

2020/05/26 Python

pyecharts在数据可视化中的应用详解

2020/06/08 Python

python中最小二乘法详细讲解

2021/02/19 Python

编写strcpy函数

2014/06/24 面试题

2019年.net常见面试问题

2012/02/12 面试题

预备党员入党思想汇报

2014/01/04 职场文书

光荣入党自我鉴定

2014/01/22 职场文书

导游个人求职信

2014/04/25 职场文书

警察先进个人事迹材料

2014/05/16 职场文书

装饰工程师岗位职责

2014/06/08 职场文书

以权谋私检举信范文

2015/03/02 职场文书

签字仪式主持词

2015/07/03 职场文书

医院保洁员管理制度

2015/08/05 职场文书

化验室安全管理制度

2015/08/06 职场文书

学生会2016感恩节活动小结

2016/04/01 职场文书

Spring Boot DevTools 全局配置学习指南

2022/03/31 Java/Android