Python爬虫:通过关键字爬取百度图片


Posted in Python onFebruary 17, 2017

使用工具:Python2.7 点我下载

scrapy框架

sublime text3

一。搭建python(Windows版本)

 1.安装python2.7 ---然后在cmd当中输入python,界面如下则安装成功

Python爬虫:通过关键字爬取百度图片

 2.集成Scrapy框架----输入命令行:pip install Scrapy

Python爬虫:通过关键字爬取百度图片

安装成功界面如下:

Python爬虫:通过关键字爬取百度图片

失败的情况很多,举例一种:

Python爬虫:通过关键字爬取百度图片

解决方案:

其余错误可百度搜索。

二。开始编程。

1.爬取无反爬虫措施的静态网站。例如百度贴吧,豆瓣读书。

例如-《桌面吧》的一个帖子https://tieba.baidu.com/p/2460150866?red_tag=3569129009

python代码如下:

Python爬虫:通过关键字爬取百度图片

代码注释:引入了两个模块urllib,re。定义两个函数,第一个函数是获取整个目标网页数据,第二个函数是在目标网页中获取目标图片,遍历网页,并且给获取的图片按照0开始排序。

注:re模块知识点:

Python爬虫:通过关键字爬取百度图片

爬取图片效果图:

Python爬虫:通过关键字爬取百度图片

图片保存路径默认在建立的.py同目录文件下。

2.爬取有反爬虫措施的百度图片。如百度图片等。

例如关键字搜索“表情包”https://image.baidu.com/search/index?tn=baiduimage&ct=201326592&lm=-1&cl=2&ie=gbk&word=%B1%ED%C7%E9%B0%FC&fr=ala&ori_query=%E8%A1%A8%E6%83%85%E5%8C%85&ala=0&alatpl=sp&pos=0&hs=2&xthttps=111111

图片采用滚动式加载,先爬取最优先的30张。

代码如下:

Python爬虫:通过关键字爬取百度图片

代码注释:导入4个模块,os模块用于指定保存路径。前两个函数同上。第三个函数使用了if语句,并tryException异常。

爬取过程如下:

Python爬虫:通过关键字爬取百度图片

爬取结果:

Python爬虫:通过关键字爬取百度图片

注:编写python代码注重对齐,and不能混用Tab和空格,易报错。

以上就是本文的全部内容,希望本文的内容对大家的学习或者工作能带来一定的帮助,同时也希望多多支持三水点靠木!

Python 相关文章推荐
Python读写Excel文件方法介绍
Nov 22 Python
简单使用Python自动生成文章
Dec 25 Python
Python版微信红包分配算法
May 04 Python
python实用代码片段收集贴
Jun 03 Python
Python3实现Web网页图片下载
Jan 28 Python
Python入门教程之运算符与控制流
Aug 17 Python
Python中str is not callable问题详解及解决办法
Feb 10 Python
TensorFlow如何实现反向传播
Feb 06 Python
python实现反转部分单向链表
Sep 27 Python
利用python脚本如何简化jar操作命令
Feb 24 Python
python 标准差计算的实现(std)
Jul 29 Python
Django实现从数据库中获取到的数据转换为dict
Mar 27 Python
Python 遍历列表里面序号和值的方法(三种)
Feb 17 #Python
浅谈python中的实例方法、类方法和静态方法
Feb 17 #Python
Python之日期与时间处理模块(date和datetime)
Feb 16 #Python
python字符串中的单双引
Feb 16 #Python
使用PyV8在Python爬虫中执行js代码
Feb 16 #Python
Python错误提示:[Errno 24] Too many open files的分析与解决
Feb 16 #Python
Python变量和数据类型详解
Feb 15 #Python
You might like
操作Oracle的php类
2006/10/09 PHP
php在文件指定行中写入代码的方法
2012/05/23 PHP
基于xcache的配置与使用详解
2013/06/18 PHP
php 删除指定文件夹的实例讲解
2017/07/25 PHP
thinkPHP框架实现的简单计算器示例
2018/12/07 PHP
JS控制表格隔行变色
2006/06/26 Javascript
简单的js分页脚本
2009/05/21 Javascript
innerhtml用法 innertext用法 以及innerHTML与innertext的区别
2009/10/26 Javascript
jQuery弹出层始终垂直居中相对于屏幕或当前窗口
2013/04/01 Javascript
Jquery实现仿腾讯娱乐频道焦点图(幻灯片)特效
2015/03/06 Javascript
jQuery实现的背景动态变化导航菜单效果
2015/08/24 Javascript
jQuery中on绑定事件后引发的事件冒泡问题如何解决
2016/05/25 Javascript
关于JS Lodop打印插件打印Bootstrap样式错乱问题的解决方案
2016/12/23 Javascript
基于JSON数据格式详解
2017/08/31 Javascript
Vue仿Bibibili首页的问题
2021/01/21 Vue.js
WebStorm无法正确识别Vue3组合式API的解决方案
2021/02/18 Vue.js
[53:29]完美世界DOTA2联赛循环赛 DM vs Matador BO2第二场 11.04
2020/11/05 DOTA
Python读写txt文本文件的操作方法全解析
2016/06/26 Python
解读python logging模块的使用方法
2018/04/17 Python
python pyinstaller 加载ui路径方法
2019/06/10 Python
python脚本开机自启的实现方法
2019/06/28 Python
PyTorch中topk函数的用法详解
2020/01/02 Python
Tensorflow训练模型越来越慢的2种解决方案
2020/02/07 Python
Python集合操作方法详解
2020/02/09 Python
完美解决keras保存好的model不能成功加载问题
2020/06/11 Python
Python实现异步IO的示例
2020/11/05 Python
python接口自动化框架实战
2020/12/23 Python
手把手教你用Django执行原生SQL的方法
2021/02/18 Python
委托书怎么写
2014/07/31 职场文书
离婚协议书范本样本
2014/08/19 职场文书
2015年元旦标语大全
2014/12/09 职场文书
医生个人年终总结
2015/02/28 职场文书
专项资金申请报告
2015/05/15 职场文书
2015新教师教学工作总结
2015/07/22 职场文书
编写python程序的90条建议
2021/04/14 Python
php 文件上传至OSS及删除远程阿里云OSS文件
2021/07/04 PHP