基于python3 的百度图片下载器的实现代码


Posted in Python onNovember 05, 2019

自己写了玩的一个小脚本,百度图片下载

import re
import os
import requests
import hashlib
 
 
def dowmloadPic(html, keyword):
  pic_url = re.findall('"objURL":"(.*?)",', html, re.S)
 
  if len(pic_url) < 1:
    return 1
 
  i = 0
  for each in pic_url:
    print(i + 1, end=',')
    md5Str = hashlib.md5(each.encode("utf-8")).hexdigest()
 
    # 抓去链接
    oneStr = md5Str + '  ' + keyword + '  ' + each + '\n'
    with open('downText.txt', 'a+') as f:
      f.write(oneStr)
 
    # 下载图片
    # try:
    #   pic = requests.get(each, timeout=10)
    # except requests.exceptions.ConnectionError:
    #   print('链接超时,跳过此操作')
    #   continue
    #
    # kz = os.path.splitext(each)[-1]
    # photo = + keyword + '_' + str(i) + kz
    #
    # with open(photo, 'wb') as f:
    #   f.write(pic.content)
    i += 1
 
  print('\n')
  return 0
 
 
if __name__ == '__main__':
 
  word = input('enter a key word:')
  page = input('enter the page:')
 
  page = int(page)
  page = 1 if page < 1 else page
 
  url = 'http://image.baidu.com/search/flip?tn=baiduimage&ie=utf-8&word=' + word + '&ct=201965323&v=flip'
 
  p = 1
  while (p <= page):
    print(word + ',第[' + str(p) + ']页:')
 
    pn = (p - 1) * 20
    url = url + '&pn=' + str(pn)
    result = requests.get(url).content.decode('utf-8')
 
    code = dowmloadPic(result, word)
 
    if code:
      print('无相关数据,提前退出程序')
      break
    p = p + 1
 
  print('程序结束')

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
教你用python3根据关键词爬取百度百科的内容
Aug 18 Python
python登录并爬取淘宝信息代码示例
Dec 09 Python
Python文本特征抽取与向量化算法学习
Dec 22 Python
python操作列表的函数使用代码详解
Dec 28 Python
wx.CheckBox创建复选框控件并响应鼠标点击事件
Apr 25 Python
PyTorch读取Cifar数据集并显示图片的实例讲解
Jul 27 Python
一百行python代码将图片转成字符画
Feb 19 Python
pyqt5 comboBox获得下标、文本和事件选中函数的方法
Jun 14 Python
使用keras和tensorflow保存为可部署的pb格式
May 25 Python
tensorflow从ckpt和从.pb文件读取变量的值方式
May 26 Python
python中如何进行连乘计算
May 28 Python
OpenCV图片漫画效果的实现示例
Aug 18 Python
Python hashlib模块加密过程解析
Nov 05 #Python
python set集合使用方法解析
Nov 05 #Python
基于python2.7实现图形密码生成器的实例代码
Nov 05 #Python
python中删除某个元素的方法解析
Nov 05 #Python
Django 框架模型操作入门教程
Nov 05 #Python
Python3.7 读取 mp3 音频文件生成波形图效果
Nov 05 #Python
python被修饰的函数消失问题解决(基于wraps函数)
Nov 04 #Python
You might like
实现“上一页”和“下一页按钮
2006/10/09 PHP
vs中通过剪切板循环来循环粘贴不同内容
2011/04/30 PHP
PHP防止跨域提交表单
2013/11/01 PHP
PDO::rollBack讲解
2019/01/29 PHP
基于Jquery的实现回车键Enter切换焦点
2010/09/14 Javascript
JavaScript前补零操作实例
2015/03/11 Javascript
JavaScript中用于四舍五入的Math.round()方法讲解
2015/06/15 Javascript
js精美的幻灯片画集特效代码分享
2015/08/29 Javascript
javascript实现的网站访问量统计代码
2015/12/20 Javascript
浅谈Javascript数据属性与访问器属性
2016/07/26 Javascript
vue 封装自定义组件之tabal列表编辑单元格组件实例代码
2017/09/07 Javascript
Node Puppeteer图像识别实现百度指数爬虫的示例
2018/02/22 Javascript
vue 解决循环引用组件报错的问题
2018/09/06 Javascript
VUE中鼠标滚轮使div左右滚动的方法详解
2020/12/14 Vue.js
[02:51]2014DOTA2 TI小组赛总结中国军团全部进军钥匙球馆
2014/07/15 DOTA
[03:34]2014DOTA2西雅图国际邀请赛 淘汰赛7月15日TOPPLAY
2014/07/15 DOTA
[50:02]完美世界DOTA2联赛循环赛 Magma vs IO BO2第一场 11.01
2020/11/02 DOTA
python 生成目录树及显示文件大小的代码
2009/07/23 Python
Python中一些自然语言工具的使用的入门教程
2015/04/13 Python
Python django实现简单的邮件系统发送邮件功能
2017/07/14 Python
python用插值法绘制平滑曲线
2021/02/19 Python
python 读取竖线分隔符的文本方法
2018/12/20 Python
Python 自动登录淘宝并保存登录信息的方法
2019/09/04 Python
使用python绘制温度变化雷达图
2019/10/18 Python
python 3.8.3 安装配置图文教程
2020/05/21 Python
Python爬取12306车次信息代码详解
2020/08/12 Python
基于Python的接口自动化读写excel文件的方法
2021/01/15 Python
HTML5 canvas基本绘图之图形组合
2016/06/27 HTML / CSS
浅析HTML5 meta viewport参数
2020/10/28 HTML / CSS
澳大利亚波希米亚风时尚品牌:Tree of Life
2019/09/15 全球购物
判断单链表中是否存在环
2012/07/16 面试题
绿色环保标语
2014/06/12 职场文书
英语邀请函范文
2015/02/02 职场文书
Java Socket实现多人聊天系统
2021/07/15 Java/Android
HTML怎么设置下划线?html文字加下划线方法
2021/12/06 HTML / CSS
windows11选中自动复制怎么开启? Win11自动复制所选内容的方法
2022/07/23 数码科技