Python使用爬虫抓取美女图片并保存到本地的方法【测试可用】


Posted in Python onAugust 30, 2018

本文实例讲述了Python使用爬虫抓取美女图片并保存到本地的方法。分享给大家供大家参考,具体如下:

图片资源来自于www.qiubaichengren.com

代码基于Python 3.5.2

友情提醒:血气方刚的骚年。请

谨慎阅图!
谨慎阅图!!
谨慎阅图!!!

code:

#!/usr/bin/env python
# -*- coding: utf-8 -*-
import os
import urllib
import urllib.request
import re
from urllib.error import URLError
class QsSpider:
  def __init__(self):
    self.user_agent = 'Mozilla/4.0 (compatible; MSIE 5.5; Windows NT)'
    self.header = {'User-Agent': self.user_agent}
    self.save_dir = './pic'
    self.url = 'http://www.qiubaichengren.com/%s.html'
  def start(self):
    for i in range(1, 10):
      self.load_html(str(i))
  def load_html(self, page):
    try:
      web_path = self.url % page
      request = urllib.request.Request(web_path, headers=self.header)
      with urllib.request.urlopen(request) as f:
        html_content = f.read().decode('gb2312')
        # print(html_content)
        self.pick_pic(html_content)
    except URLError as e:
      print(e.reason)
    return
  def save_pic(self, img):
    print(img)
    save_path = self.save_dir + "/" + img.replace(':', '@').replace('/', '_')
    if not os.path.exists(self.save_dir):
      os.makedirs(self.save_dir)
    print(save_path)
    urllib.request.urlretrieve(img, save_path)
    pass
  def pick_pic(self, html_content):
    regex = r'src="(http:.*?\.(?:jpg|png|gif))'
    patten = re.compile(regex)
    pic_path_list = patten.findall(html_content)
    for i in pic_path_list:
      self.save_pic(str(i))
      print(i)
spider = QsSpider()
spider.start()

代码运行后可得到如下N多大饱眼福的美女图:

Python使用爬虫抓取美女图片并保存到本地的方法【测试可用】

更多关于Python相关内容可查看本站专题:《Python Socket编程技巧总结》、《Python正则表达式用法总结》、《Python数据结构与算法教程》、《Python函数使用技巧总结》、《Python字符串操作技巧汇总》、《Python入门与进阶经典教程》及《Python文件与目录操作技巧汇总》

希望本文所述对大家Python程序设计有所帮助。

Python 相关文章推荐
python下函数参数的传递(参数带星号的说明)
Sep 19 Python
Python中字典和集合学习小结
Jul 07 Python
Python实现购物车购物小程序
Apr 18 Python
Python+selenium 获取浏览器窗口坐标、句柄的方法
Oct 14 Python
解决在pycharm中显示额外的 figure 窗口问题
Jan 15 Python
Pandas之DataFrame对象的列和索引之间的转化
Jun 25 Python
Python-Tkinter Text输入内容在界面显示的实例
Jul 12 Python
django-rest-framework 自定义swagger过程详解
Jul 18 Python
Python猴子补丁知识点总结
Jan 05 Python
keras实现VGG16方式(预测一张图片)
Jul 07 Python
python如何实现图片压缩
Sep 11 Python
Python爬虫基础之初次使用scrapy爬虫实例
Jun 26 Python
Python使用一行代码获取上个月是几月
Aug 30 #Python
Python实现的读取/更改/写入xml文件操作示例
Aug 30 #Python
python实现录音小程序
Oct 26 #Python
Python图像处理之简单画板实现方法示例
Aug 30 #Python
浅析python中numpy包中的argsort函数的使用
Aug 30 #Python
浅析python3中的os.path.dirname(__file__)的使用
Aug 30 #Python
python语音识别实践之百度语音API
Aug 30 #Python
You might like
模仿OSO的论坛(三)
2006/10/09 PHP
phpmyadmin中配置文件现在需要绝密的短语密码的解决方法
2007/02/11 PHP
php eval函数用法总结
2012/10/31 PHP
CentOS 6.2使用yum安装LAMP以及phpMyadmin详解
2013/06/17 PHP
ThinkPHP中的常用查询语言汇总
2014/08/22 PHP
typecho插件编写教程(三):保存配置
2015/05/28 PHP
删除重复数据的算法
2006/11/23 Javascript
JQuery最佳实践之精妙的自定义事件
2010/08/11 Javascript
jQuery动态添加 input type=file的实现代码
2012/06/14 Javascript
如何判断鼠标是否在DIV的区域内
2013/11/13 Javascript
jQuery中Ajax的load方法详解
2015/01/14 Javascript
jquery实现焦点图片随机切换效果的方法
2015/03/12 Javascript
JS实现的倒计时效果实例(2则实例)
2015/12/23 Javascript
不间断循环滚动效果的实例代码(必看篇)
2016/10/08 Javascript
JavaScript实现一个空中避难的小游戏
2017/06/06 Javascript
引入JavaScript时alert弹出框显示中文乱码问题
2017/09/16 Javascript
JavaScript实现QQ列表展开收缩扩展功能
2017/10/30 Javascript
vue-cli配置环境变量的方法
2018/07/09 Javascript
vue以组件或者插件的形式实现throttle或者debounce
2019/05/22 Javascript
Node.JS获取GET,POST数据之queryString模块使用方法详解
2020/02/06 Javascript
python append、extend与insert的区别
2016/10/13 Python
python 读写中文json的实例详解
2017/10/29 Python
python绘制铅球的运行轨迹代码分享
2017/11/14 Python
Pytorch 实现自定义参数层的例子
2019/08/17 Python
python统计字符的个数代码实例
2020/02/07 Python
Python解析m3u8拼接下载mp4视频文件的示例代码
2021/03/03 Python
时尚的CSS3进度条效果
2012/02/22 HTML / CSS
纯CSS3发光分享按钮的实现教程
2014/09/06 HTML / CSS
澳大利亚领先的睡衣品牌:Peter Alexander
2016/08/16 全球购物
别名指示符是什么
2012/10/08 面试题
万户网络JAVA程序员岗位招聘笔试试卷
2013/01/08 面试题
客服文员岗位职责
2013/11/29 职场文书
司机检讨书
2014/02/13 职场文书
中学生自我评价范文
2015/03/03 职场文书
Python Pandas 删除列操作
2022/03/16 Python
Springboot集成kafka高级应用实战分享
2022/08/14 Java/Android