Python使用爬虫抓取美女图片并保存到本地的方法【测试可用】


Posted in Python onAugust 30, 2018

本文实例讲述了Python使用爬虫抓取美女图片并保存到本地的方法。分享给大家供大家参考,具体如下:

图片资源来自于www.qiubaichengren.com

代码基于Python 3.5.2

友情提醒:血气方刚的骚年。请

谨慎阅图!
谨慎阅图!!
谨慎阅图!!!

code:

#!/usr/bin/env python
# -*- coding: utf-8 -*-
import os
import urllib
import urllib.request
import re
from urllib.error import URLError
class QsSpider:
  def __init__(self):
    self.user_agent = 'Mozilla/4.0 (compatible; MSIE 5.5; Windows NT)'
    self.header = {'User-Agent': self.user_agent}
    self.save_dir = './pic'
    self.url = 'http://www.qiubaichengren.com/%s.html'
  def start(self):
    for i in range(1, 10):
      self.load_html(str(i))
  def load_html(self, page):
    try:
      web_path = self.url % page
      request = urllib.request.Request(web_path, headers=self.header)
      with urllib.request.urlopen(request) as f:
        html_content = f.read().decode('gb2312')
        # print(html_content)
        self.pick_pic(html_content)
    except URLError as e:
      print(e.reason)
    return
  def save_pic(self, img):
    print(img)
    save_path = self.save_dir + "/" + img.replace(':', '@').replace('/', '_')
    if not os.path.exists(self.save_dir):
      os.makedirs(self.save_dir)
    print(save_path)
    urllib.request.urlretrieve(img, save_path)
    pass
  def pick_pic(self, html_content):
    regex = r'src="(http:.*?\.(?:jpg|png|gif))'
    patten = re.compile(regex)
    pic_path_list = patten.findall(html_content)
    for i in pic_path_list:
      self.save_pic(str(i))
      print(i)
spider = QsSpider()
spider.start()

代码运行后可得到如下N多大饱眼福的美女图:

Python使用爬虫抓取美女图片并保存到本地的方法【测试可用】

更多关于Python相关内容可查看本站专题:《Python Socket编程技巧总结》、《Python正则表达式用法总结》、《Python数据结构与算法教程》、《Python函数使用技巧总结》、《Python字符串操作技巧汇总》、《Python入门与进阶经典教程》及《Python文件与目录操作技巧汇总》

希望本文所述对大家Python程序设计有所帮助。

Python 相关文章推荐
python使用smtplib模块通过gmail实现邮件发送的方法
May 08 Python
Python实现感知机(PLA)算法
Dec 20 Python
TensorFlow如何实现反向传播
Feb 06 Python
浅谈Tensorflow由于版本问题出现的几种错误及解决方法
Jun 13 Python
selenium+python 对输入框的输入处理方法
Oct 11 Python
Python+PyQt5实现美剧爬虫可视工具的方法
Apr 25 Python
python基于三阶贝塞尔曲线的数据平滑算法
Dec 27 Python
tensorflow没有output结点,存储成pb文件的例子
Jan 04 Python
Python使用matplotlib绘制圆形代码实例
May 27 Python
Python参数传递及收集机制原理解析
Jun 05 Python
Python实现播放和录制声音的功能
Aug 12 Python
Python实现生活常识解答机器人
Jun 28 Python
Python使用一行代码获取上个月是几月
Aug 30 #Python
Python实现的读取/更改/写入xml文件操作示例
Aug 30 #Python
python实现录音小程序
Oct 26 #Python
Python图像处理之简单画板实现方法示例
Aug 30 #Python
浅析python中numpy包中的argsort函数的使用
Aug 30 #Python
浅析python3中的os.path.dirname(__file__)的使用
Aug 30 #Python
python语音识别实践之百度语音API
Aug 30 #Python
You might like
Breeze 文章管理系统 v1.0.0正式发布
2006/12/14 PHP
关于PHP中Object对象的笔记分享
2011/06/28 PHP
PHP中将字符串转化为整数(int) intval() printf() 性能测试
2020/03/20 PHP
jQuery中 noConflict() 方法使用
2013/04/25 Javascript
javascript浏览器兼容教程之事件处理
2014/06/09 Javascript
jQuery的css()方法用法实例
2014/12/24 Javascript
跟我学习javascript的浮点数精度
2015/11/16 Javascript
javascript之IE版本检测超简单方法
2016/08/20 Javascript
jquery 实现回车登录详解及实例代码
2016/10/23 Javascript
基于jQuery实现的查看全文功能【实用】
2016/12/11 Javascript
jQuery插件FusionWidgets实现的AngularGauge图效果示例【附demo源码】
2017/03/23 jQuery
浅谈在不使用ssr的情况下解决Vue单页面SEO问题(2)
2018/11/08 Javascript
浅谈ng-zorro使用心得
2018/12/03 Javascript
javascript中call()、apply()的区别
2019/03/21 Javascript
Layui实现主窗口和Iframe层参数传递
2019/11/14 Javascript
[53:10]完美世界DOTA2联赛决赛日 FTD vs GXR 第二场 11.08
2020/11/11 DOTA
python获取文件版本信息、公司名和产品名的方法
2014/10/05 Python
python中使用mysql数据库详细介绍
2015/03/27 Python
python统计文本文件内单词数量的方法
2015/05/30 Python
Python SQLite3数据库日期与时间常见函数用法分析
2017/08/14 Python
Python2随机数列生成器简单实例
2017/09/04 Python
Python 按字典dict的键排序,并取出相应的键值放于list中的实例
2019/02/12 Python
用Python中的turtle模块画图两只小羊方法
2019/04/09 Python
Python目录和文件处理总结详解
2019/09/02 Python
python:动态路由的Flask程序代码
2019/11/22 Python
TensorFlow-gpu和opencv安装详细教程
2020/06/30 Python
使用CSS3的appearance属性改变元素的外观的方法
2015/12/12 HTML / CSS
CSS3 实现童年的纸飞机
2019/05/05 HTML / CSS
使用PDF.JS插件在HTML中预览PDF文件的方法
2018/08/29 HTML / CSS
波兰最大的宠物用品网上商店:FERA.PL
2019/08/11 全球购物
什么是虚拟内存?虚拟内存有什么优势?
2012/02/19 面试题
高校十八大报告感想
2014/01/27 职场文书
优秀员工推荐材料
2014/12/20 职场文书
初任公务员培训心得体会
2016/01/08 职场文书
教你怎么用Python selenium操作浏览器对象的基础API
2021/06/23 Python
SQL Server的存储过程与触发器以及系统函数和自定义函数
2022/04/10 SQL Server