python实现爬取百度图片的方法示例


Posted in Python onJuly 06, 2019

本文实例讲述了python实现爬取百度图片的方法。分享给大家供大家参考,具体如下:

import json
import itertools
import urllib
import requests
import os
import re
import sys
word=input("请输入关键字:")
path="./ok"
if not os.path.exists(path):
  os.mkdir(path)
word=urllib.parse.quote(word)
url = r"http://image.baidu.com/search/acjson?tn=resultjson_com&ipn=rj&ct=201326592&fp=result&queryWord={word}&cl=2&lm=-1&ie=utf-8&oe=utf-8&st=-1&ic=0&word={word}&face=0&istype=2nc=1&pn={pn}&rn=60"
urls=(url.format(word=word,pn=x)for x in itertools.count(start=0,step=60))
index=0
str_table = {
  '_z2C$q': ':',
  '_z&e3B': '.',
  'AzdH3F': '/'
}
char_table = {
  'w': 'a',
  'k': 'b',
  'v': 'c',
  '1': 'd',
  'j': 'e',
  'u': 'f',
  '2': 'g',
  'i': 'h',
  't': 'i',
  '3': 'j',
  'h': 'k',
  's': 'l',
  '4': 'm',
  'g': 'n',
  '5': 'o',
  'r': 'p',
  'q': 'q',
  '6': 'r',
  'f': 's',
  'p': 't',
  '7': 'u',
  'e': 'v',
  'o': 'w',
  '8': '1',
  'd': '2',
  'n': '3',
  '9': '4',
  'c': '5',
  'm': '6',
  '0': '7',
  'b': '8',
  'l': '9',
  'a': '0'
}
i=1
char_table = {ord(key): ord(value) for key, value in char_table.items()}
for url in urls:
  html=requests.get(url,timeout=10).text
  a=re.compile(r'"objURL":"(.*?)"')
  downURL=re.findall(a,html)
  for t in downURL:
    for key, value in str_table.items():
        t = t.replace(key, value)
    t=t.translate(char_table)
    try:
      html_1=requests.get(t)
      if str(html_1.status_code)[0]=="4":
        print('失败1')
        continue
    except Exception as e:
      print('失败2')
      continue
    with open(path+"/"+str(i)+".jpg",'wb') as f:
      f.write(html_1.content)
    i=i+1

更多关于Python相关内容可查看本站专题:《Python Socket编程技巧总结》、《Python正则表达式用法总结》、《Python数据结构与算法教程》、《Python函数使用技巧总结》、《Python字符串操作技巧汇总》、《Python入门与进阶经典教程》及《Python文件与目录操作技巧汇总》

希望本文所述对大家Python程序设计有所帮助。

Python 相关文章推荐
python使用点操作符访问字典(dict)数据的方法
Mar 16 Python
Linux 下 Python 实现按任意键退出的实现方法
Sep 25 Python
Python docx库用法示例分析
Feb 16 Python
Python中字符串与编码示例代码
May 20 Python
Python函数和模块的使用总结
May 20 Python
python频繁写入文件时提速的方法
Jun 26 Python
Pytorch中index_select() 函数的实现理解
Nov 19 Python
基于MSELoss()与CrossEntropyLoss()的区别详解
Jan 02 Python
Python正则表达式学习小例子
Mar 03 Python
Selenium基于PIL实现拼接滚动截图
Apr 10 Python
Python新手学习标准库模块命名
May 29 Python
Python中使用subprocess库创建附加进程
May 11 Python
python实现控制电脑鼠标和键盘,登录QQ的方法示例
Jul 06 #Python
python3 打印输出字典中特定的某个key的方法示例
Jul 06 #Python
python使用 zip 同时迭代多个序列示例
Jul 06 #Python
Python搭建Spark分布式集群环境
Jul 05 #Python
详解python解压压缩包的五种方法
Jul 05 #Python
用python3 返回鼠标位置的实现方法(带界面)
Jul 05 #Python
python中的colorlog库使用详解
Jul 05 #Python
You might like
PHP面向对象法则
2012/02/23 PHP
PHP常见字符串处理函数用法示例【转换,转义,截取,比较,查找,反转,切割】
2016/12/24 PHP
PHP使用GD库制作验证码的方法(点击验证码或看不清会刷新验证码)
2017/08/15 PHP
PHP 自动加载类原理与用法实例分析
2020/04/14 PHP
js脚本学习 比较实用的基础
2006/09/07 Javascript
flexigrid 参数说明
2010/11/23 Javascript
简单js代码实现selece二级联动(推荐)
2014/02/18 Javascript
jQuery模拟原生态App上拉刷新下拉加载更多页面及原理
2015/08/10 Javascript
js实现文本框支持加减运算的方法
2015/08/19 Javascript
JS实现的车标图片提示效果代码
2015/10/10 Javascript
快速掌握jQuery插件WebUploader文件上传
2016/11/07 Javascript
js遮罩效果制作弹出注册界面效果
2017/01/25 Javascript
JavaScript中双向数据绑定详解
2017/05/03 Javascript
ES6正则表达式的一些新功能总结
2017/05/09 Javascript
Vue无限滑动周选择日期的组件的示例代码
2018/07/18 Javascript
vue项目打包后上传至GitHub并实现github-pages的预览
2019/05/06 Javascript
浅谈TypeScript 用 Webpack/ts-node 运行的配置记录
2019/10/11 Javascript
[03:58]2014DOTA2国际邀请赛 龙宝赛后解密DK获胜之道
2014/07/14 DOTA
[03:39]2015国际邀请赛主赛事首日精彩回顾
2015/08/05 DOTA
通过Python 接口使用OpenCV的方法
2018/04/02 Python
使用python实现语音文件的特征提取方法
2019/01/09 Python
详解pandas数据合并与重塑(pd.concat篇)
2019/07/09 Python
在Pytorch中使用Mask R-CNN进行实例分割操作
2020/06/24 Python
浅谈keras中的keras.utils.to_categorical用法
2020/07/02 Python
html5基础教程常用技巧整理
2013/08/20 HTML / CSS
玩具反斗城天猫官方旗舰店:享誉全球的玩具店
2017/10/10 全球购物
Linux管理员面试题 Linux admin interview questions
2014/11/01 面试题
如何反序的迭代一个序列?how do I iterate over a sequence in reverse order
2012/02/04 面试题
会计工作心得体会
2014/01/13 职场文书
努力学习演讲稿
2014/05/10 职场文书
基层党建工作汇报材料
2014/08/15 职场文书
民事撤诉申请书范本
2015/05/18 职场文书
父亲去世追悼词
2015/06/23 职场文书
2015大学迎新晚会策划书
2015/07/16 职场文书
2019年感恩励志演讲稿(收藏备用)
2019/09/11 职场文书
Nginx 路由转发和反向代理location配置实现
2021/11/11 Servers