Python使用爬虫抓取美女图片并保存到本地的方法【测试可用】


Posted in Python onAugust 30, 2018

本文实例讲述了Python使用爬虫抓取美女图片并保存到本地的方法。分享给大家供大家参考,具体如下:

图片资源来自于www.qiubaichengren.com

代码基于Python 3.5.2

友情提醒:血气方刚的骚年。请

谨慎阅图!
谨慎阅图!!
谨慎阅图!!!

code:

#!/usr/bin/env python
# -*- coding: utf-8 -*-
import os
import urllib
import urllib.request
import re
from urllib.error import URLError
class QsSpider:
  def __init__(self):
    self.user_agent = 'Mozilla/4.0 (compatible; MSIE 5.5; Windows NT)'
    self.header = {'User-Agent': self.user_agent}
    self.save_dir = './pic'
    self.url = 'http://www.qiubaichengren.com/%s.html'
  def start(self):
    for i in range(1, 10):
      self.load_html(str(i))
  def load_html(self, page):
    try:
      web_path = self.url % page
      request = urllib.request.Request(web_path, headers=self.header)
      with urllib.request.urlopen(request) as f:
        html_content = f.read().decode('gb2312')
        # print(html_content)
        self.pick_pic(html_content)
    except URLError as e:
      print(e.reason)
    return
  def save_pic(self, img):
    print(img)
    save_path = self.save_dir + "/" + img.replace(':', '@').replace('/', '_')
    if not os.path.exists(self.save_dir):
      os.makedirs(self.save_dir)
    print(save_path)
    urllib.request.urlretrieve(img, save_path)
    pass
  def pick_pic(self, html_content):
    regex = r'src="(http:.*?\.(?:jpg|png|gif))'
    patten = re.compile(regex)
    pic_path_list = patten.findall(html_content)
    for i in pic_path_list:
      self.save_pic(str(i))
      print(i)
spider = QsSpider()
spider.start()

代码运行后可得到如下N多大饱眼福的美女图:

Python使用爬虫抓取美女图片并保存到本地的方法【测试可用】

更多关于Python相关内容可查看本站专题:《Python Socket编程技巧总结》、《Python正则表达式用法总结》、《Python数据结构与算法教程》、《Python函数使用技巧总结》、《Python字符串操作技巧汇总》、《Python入门与进阶经典教程》及《Python文件与目录操作技巧汇总》

希望本文所述对大家Python程序设计有所帮助。

Python 相关文章推荐
Python urllib、urllib2、httplib抓取网页代码实例
May 09 Python
简单学习Python多进程Multiprocessing
Aug 29 Python
Python交互环境下实现输入代码
Jun 22 Python
python实现杨氏矩阵查找
Mar 02 Python
Python pandas.DataFrame调整列顺序及修改index名的方法
Jun 21 Python
Python爬虫 scrapy框架爬取某招聘网存入mongodb解析
Jul 31 Python
python3.6生成器yield用法实例分析
Aug 23 Python
logging level级别介绍
Feb 21 Python
python3中sorted函数里cmp参数改变详解
Mar 12 Python
解决Jupyter notebook更换主题工具栏被隐藏及添加目录生成插件问题
Apr 20 Python
Python基于requests实现模拟上传文件
Apr 21 Python
用PYTHON去计算88键钢琴的琴键频率和音高
Apr 10 Python
Python使用一行代码获取上个月是几月
Aug 30 #Python
Python实现的读取/更改/写入xml文件操作示例
Aug 30 #Python
python实现录音小程序
Oct 26 #Python
Python图像处理之简单画板实现方法示例
Aug 30 #Python
浅析python中numpy包中的argsort函数的使用
Aug 30 #Python
浅析python3中的os.path.dirname(__file__)的使用
Aug 30 #Python
python语音识别实践之百度语音API
Aug 30 #Python
You might like
php array_map()数组函数使用说明
2011/07/12 PHP
php array_pop()数组函数将数组最后一个单元弹出(出栈)
2011/07/12 PHP
详解PHP编码转换函数应用技巧
2016/10/22 PHP
PHP写的简单数字验证码实例
2017/05/23 PHP
php使用yield对性能提升的测试实例分析
2019/09/19 PHP
JavaScript中的细节分析
2012/06/30 Javascript
jQuery实现随意改变div任意属性的名称和值(部分原生js实现)
2013/05/28 Javascript
js判断浏览器类型的方法
2013/08/07 Javascript
php跨域调用json的例子
2013/11/13 Javascript
nodejs实现的一个简单聊天室功能分享
2014/12/06 NodeJs
jquery+json实现分页效果
2016/03/07 Javascript
js实现当鼠标移到表格上时显示这一格全部内容的代码
2016/06/12 Javascript
jQuery监听浏览器窗口大小的变化实例
2017/02/07 Javascript
BootStrap+Mybatis框架下实现表单提交数据重复验证
2017/03/23 Javascript
vue根据进入的路由进行原路返回的方法
2018/09/26 Javascript
微信小程序dom操作的替代思路实例分析
2018/12/06 Javascript
TypeScript中使用getElementXXX()的示例代码
2019/09/12 Javascript
详解Vue的watch中的immediate与watch是什么意思
2019/12/30 Javascript
详解JavaScript中的Object.is()与"==="运算符总结
2020/06/17 Javascript
[59:08]Ti4 冒泡赛第二天 NEWBEE vs Titan 2
2014/07/15 DOTA
Python开发常用的一些开源Package分享
2015/02/14 Python
分析Python的Django框架的运行方式及处理流程
2015/04/08 Python
解决Python selenium get页面很慢时的问题
2019/01/30 Python
Python+pyplot绘制带文本标注的柱状图方法
2019/07/08 Python
Python如何实现的二分查找算法
2020/05/27 Python
如何用python处理excel表格
2020/06/09 Python
使用python编写一个语音朗读闹钟功能的示例代码
2020/07/14 Python
时尚的CSS3进度条效果
2012/02/22 HTML / CSS
Java的for语句中break, continue和return的区别
2013/12/19 面试题
医科大学毕业生自荐信
2014/02/03 职场文书
青年教师培训方案
2014/02/06 职场文书
数学教育专业求职信
2014/07/22 职场文书
2016庆祝教师节新闻稿
2015/11/25 职场文书
2019入党申请书格式和范文
2019/06/25 职场文书
创业计划书之溜冰场
2019/10/25 职场文书
《乙女游戏世界对路人角色很不友好》OP主题曲无字幕动画MV公开
2022/04/05 日漫