python爬不同图片分别保存在不同文件夹中的实现


Posted in Python onApril 02, 2021

例如,爬取赵丽颖,赵本山,赵文卓,赵欢,赵日天的图片分别保存在赵丽颖,赵本山,赵文卓,赵欢,赵日天命名的文件夹中,

测试代码

python爬不同图片分别保存在不同文件夹中的实现

python爬不同图片分别保存在不同文件夹中的实现

别的图就不放了

import requests
import time
import os
# 请求头,伪装成浏览器
headers = {
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/53.0.2785.116 Safari/537.36'
}
# keyword = '云斑白条天牛' # 关键字
keywords = ['赵丽颖','赵本山','赵文卓','赵欢','赵日天']
max_page = 2
i=1 # 记录图片数
for keyword in keywords:
  
  os.makedirs(keyword)
  for page in range(1,max_page):
    page = page*30
    # 网址
    url = 'https://image.baidu.com/search/acjson?tn=resultjson_com&ipn=rj&ct=201326592&is=&fp=result&queryWord='\
        +keyword+'&cl=2&lm=-1&ie=utf-8&oe=utf-8&adpicid=&st=-1&z=&ic=0&hd=&latest=&copyright=&word='\
        +keyword+'&s=&se=&tab=&width=&height=&face=0&istype=2&qc=&nc=1&fr=&expermode=&force=&cg=wallpaper&pn='\
        +str(page)+'&rn=30&gsm=1e&1596899786625='
    # 请求响应
    response = requests.get(url=url,headers=headers)
    # 得到相应的json数据
    json = response.json()
    if json.get('data'):
      for item in json.get('data')[:30]:
        # 图片地址
        img_url = item.get('thumbURL')
        # 获取图片
        image = requests.get(url=img_url)
        # 下载图片
        newstr = './'+keyword+'/'+str(i)+'.jpg'
        # with open('./%s/%d.jpg'%keywords ,%i,'wb') as f:
        with open(newstr,'wb') as f:
          f.write(image.content) # 图片二进制数据
        time.sleep(1) # 等待1s
        print('第%d张%s图片下载完成...'%(i,keyword))
        i+=1
print('End!')

你要修改的参数

将你想要爬的数据填入keywords 数组中即可

# 这里放你要查询的数组
keywords = ['','','',']

max_page是爬取百度图片的页数,一页是30张,这里写2的话就能爬30张,3能爬60张,以此类推

max_page = 3

你要的代码

代码如下:

import requests
import time
import os
# 请求头,伪装成浏览器
headers = {
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/53.0.2785.116 Safari/537.36'
}
# 这里放你要查询的数组
keywords = ['','','',']
max_page = 4
i=1 # 记录图片数
for keyword in keywords:
  
  os.makedirs(keyword)
  for page in range(1,max_page):
    page = page*30
    # 网址
    url = 'https://image.baidu.com/search/acjson?tn=resultjson_com&ipn=rj&ct=201326592&is=&fp=result&queryWord='\
        +keyword+'&cl=2&lm=-1&ie=utf-8&oe=utf-8&adpicid=&st=-1&z=&ic=0&hd=&latest=&copyright=&word='\
        +keyword+'&s=&se=&tab=&width=&height=&face=0&istype=2&qc=&nc=1&fr=&expermode=&force=&cg=wallpaper&pn='\
        +str(page)+'&rn=30&gsm=1e&1596899786625='
    # 请求响应
    response = requests.get(url=url,headers=headers)
    # 得到相应的json数据
    json = response.json()
    if json.get('data'):
      for item in json.get('data')[:30]:
        # 图片地址
        img_url = item.get('thumbURL')
        # 获取图片
        image = requests.get(url=img_url)
        # 下载图片
        newstr = './'+keyword+'/'+str(i)+'.jpg'
        # with open('./%s/%d.jpg'%keywords ,%i,'wb') as f:
        with open(newstr,'wb') as f:
          f.write(image.content) # 图片二进制数据
        time.sleep(1) # 等待1s
        print('第%d张%s图片下载完成...'%(i,keyword))
        i+=1  
print('End!')

到此这篇关于python爬不同图片分别保存在不同文件夹中的实现的文章就介绍到这了,更多相关python爬图片保存不同文件夹内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
python读写ini文件示例(python读写文件)
Mar 25 Python
python进阶教程之词典、字典、dict
Aug 29 Python
win10系统中安装scrapy-1.1
Jul 03 Python
python实现简易云音乐播放器
Jan 04 Python
Python 3 实现定义跨模块的全局变量和使用教程
Jul 07 Python
python多线程共享变量的使用和效率方法
Jul 16 Python
python——全排列数的生成方式
Feb 26 Python
PyCharm 2020 激活到 2100 年的教程
Mar 25 Python
UI自动化定位常用实现方法代码示例
Oct 27 Python
python 统计list中各个元素出现的次数的几种方法
Feb 20 Python
关于的python五子棋的算法
May 02 Python
Python Flask实现进度条
May 11 Python
Python读取文件夹下的所有文件实例代码
如何用python识别滑块验证码中的缺口
python 实现定时任务的四种方式
Apr 01 #Python
python读取pdf格式文档的实现代码
Python中使用Lambda函数的5种用法
Apr 01 #Python
python 实现mysql自动增删分区的方法
Apr 01 #Python
pygame面向对象的飞行小鸟实现(Flappy bird)
You might like
php中修改浏览器的User-Agent来伪装你的浏览器和操作系统
2011/07/29 PHP
PHP使用curl函数发送Post请求的注意事项
2016/11/26 PHP
使用TextRange获取输入框中光标的位置的代码
2007/03/08 Javascript
JQuery与JS里submit()的区别示例介绍
2014/02/17 Javascript
jquery跟js初始化加载的多种方法及区别介绍
2014/04/02 Javascript
js获取浏览器基本信息大全
2014/11/27 Javascript
jQuery 重复加载错误以及修复方法
2014/12/16 Javascript
Jquery 1.9.1源码分析系列(十二)之筛选操作
2015/12/02 Javascript
BootStrap智能表单实战系列(八)表单配置json详解
2016/06/13 Javascript
详解axios在node.js中的post使用
2017/04/27 Javascript
vue.js 初体验之Chrome 插件开发实录
2017/05/13 Javascript
bootstrap daterangepicker双日历时间段选择控件详解
2017/06/15 Javascript
vue cli2.0单页面title修改方法
2018/06/07 Javascript
详解如何在nuxt中添加proxyTable代理
2018/08/10 Javascript
Node.JS发送http请求批量检查文件中的网页地址、服务是否有效可用
2019/11/20 Javascript
js实现倒计时秒杀效果
2020/03/25 Javascript
js实现列表按字母排序
2020/08/11 Javascript
在vue中获取wangeditor的html和text的操作
2020/10/23 Javascript
[00:34]TI7不朽珍藏III——纯金地穴编织者饰品展示
2017/07/15 DOTA
[01:03:03]VP vs Mineski 2018国际邀请赛淘汰赛BO3 第一场 8.22
2018/08/23 DOTA
python抓取豆瓣图片并自动保存示例学习
2014/01/10 Python
python将字典内容存入mysql实例代码
2018/01/18 Python
python 实现对文件夹中的图像连续重命名方法
2018/10/25 Python
python 一篇文章搞懂装饰器所有用法(建议收藏)
2019/08/23 Python
python 爬取马蜂窝景点翻页文字评论的实现
2020/01/20 Python
用Python制作mini翻译器的实现示例
2020/08/17 Python
Python 在 VSCode 中使用 IPython Kernel 的方法详解
2020/09/05 Python
css3实现3d旋转动画特效
2015/03/10 HTML / CSS
凯撒娱乐:Caesars Entertainment
2018/02/23 全球购物
西班牙品牌鞋子、服装和配饰在线商店:Esdemarca
2021/02/17 全球购物
九年级物理教学反思
2014/01/29 职场文书
运动会跳远广播稿
2014/02/04 职场文书
中国好声音广告词
2014/03/18 职场文书
婚前保证书
2014/04/29 职场文书
小学生作文之《压岁钱的烦恼》
2019/09/27 职场文书
使用 Apache Dubbo 实现远程通信(微服务架构)
2022/02/12 Servers