python爬不同图片分别保存在不同文件夹中的实现


Posted in Python onApril 02, 2021

例如,爬取赵丽颖,赵本山,赵文卓,赵欢,赵日天的图片分别保存在赵丽颖,赵本山,赵文卓,赵欢,赵日天命名的文件夹中,

测试代码

python爬不同图片分别保存在不同文件夹中的实现

python爬不同图片分别保存在不同文件夹中的实现

别的图就不放了

import requests
import time
import os
# 请求头,伪装成浏览器
headers = {
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/53.0.2785.116 Safari/537.36'
}
# keyword = '云斑白条天牛' # 关键字
keywords = ['赵丽颖','赵本山','赵文卓','赵欢','赵日天']
max_page = 2
i=1 # 记录图片数
for keyword in keywords:
  
  os.makedirs(keyword)
  for page in range(1,max_page):
    page = page*30
    # 网址
    url = 'https://image.baidu.com/search/acjson?tn=resultjson_com&ipn=rj&ct=201326592&is=&fp=result&queryWord='\
        +keyword+'&cl=2&lm=-1&ie=utf-8&oe=utf-8&adpicid=&st=-1&z=&ic=0&hd=&latest=&copyright=&word='\
        +keyword+'&s=&se=&tab=&width=&height=&face=0&istype=2&qc=&nc=1&fr=&expermode=&force=&cg=wallpaper&pn='\
        +str(page)+'&rn=30&gsm=1e&1596899786625='
    # 请求响应
    response = requests.get(url=url,headers=headers)
    # 得到相应的json数据
    json = response.json()
    if json.get('data'):
      for item in json.get('data')[:30]:
        # 图片地址
        img_url = item.get('thumbURL')
        # 获取图片
        image = requests.get(url=img_url)
        # 下载图片
        newstr = './'+keyword+'/'+str(i)+'.jpg'
        # with open('./%s/%d.jpg'%keywords ,%i,'wb') as f:
        with open(newstr,'wb') as f:
          f.write(image.content) # 图片二进制数据
        time.sleep(1) # 等待1s
        print('第%d张%s图片下载完成...'%(i,keyword))
        i+=1
print('End!')

你要修改的参数

将你想要爬的数据填入keywords 数组中即可

# 这里放你要查询的数组
keywords = ['','','',']

max_page是爬取百度图片的页数,一页是30张,这里写2的话就能爬30张,3能爬60张,以此类推

max_page = 3

你要的代码

代码如下:

import requests
import time
import os
# 请求头,伪装成浏览器
headers = {
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/53.0.2785.116 Safari/537.36'
}
# 这里放你要查询的数组
keywords = ['','','',']
max_page = 4
i=1 # 记录图片数
for keyword in keywords:
  
  os.makedirs(keyword)
  for page in range(1,max_page):
    page = page*30
    # 网址
    url = 'https://image.baidu.com/search/acjson?tn=resultjson_com&ipn=rj&ct=201326592&is=&fp=result&queryWord='\
        +keyword+'&cl=2&lm=-1&ie=utf-8&oe=utf-8&adpicid=&st=-1&z=&ic=0&hd=&latest=&copyright=&word='\
        +keyword+'&s=&se=&tab=&width=&height=&face=0&istype=2&qc=&nc=1&fr=&expermode=&force=&cg=wallpaper&pn='\
        +str(page)+'&rn=30&gsm=1e&1596899786625='
    # 请求响应
    response = requests.get(url=url,headers=headers)
    # 得到相应的json数据
    json = response.json()
    if json.get('data'):
      for item in json.get('data')[:30]:
        # 图片地址
        img_url = item.get('thumbURL')
        # 获取图片
        image = requests.get(url=img_url)
        # 下载图片
        newstr = './'+keyword+'/'+str(i)+'.jpg'
        # with open('./%s/%d.jpg'%keywords ,%i,'wb') as f:
        with open(newstr,'wb') as f:
          f.write(image.content) # 图片二进制数据
        time.sleep(1) # 等待1s
        print('第%d张%s图片下载完成...'%(i,keyword))
        i+=1  
print('End!')

到此这篇关于python爬不同图片分别保存在不同文件夹中的实现的文章就介绍到这了,更多相关python爬图片保存不同文件夹内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
python 读取excel文件生成sql文件实例详解
May 12 Python
老生常谈Python基础之字符编码
Jun 14 Python
Python内置函数 next的具体使用方法
Nov 24 Python
python实现日常记账本小程序
Mar 10 Python
pandas 实现将重复表格去重,并重新转换为表格的方法
Apr 18 Python
python 根据时间来生成唯一的字符串方法
Jan 14 Python
Python正则表达式匹配日期与时间的方法
Jul 07 Python
python__new__内置静态方法使用解析
Jan 07 Python
python实现扑克牌交互式界面发牌程序
Apr 22 Python
浅谈Python程序的错误:变量未定义
Jun 02 Python
详解Python IO编程
Jul 24 Python
python获取百度热榜链接的实例方法
Aug 25 Python
Python读取文件夹下的所有文件实例代码
如何用python识别滑块验证码中的缺口
python 实现定时任务的四种方式
Apr 01 #Python
python读取pdf格式文档的实现代码
Python中使用Lambda函数的5种用法
Apr 01 #Python
python 实现mysql自动增删分区的方法
Apr 01 #Python
pygame面向对象的飞行小鸟实现(Flappy bird)
You might like
PHP教程 基本语法
2009/10/23 PHP
php判断文件夹是否存在不存在则创建
2015/04/09 PHP
Yii中CArrayDataProvider和CActiveDataProvider区别实例分析
2016/03/02 PHP
php中final关键字用法分析
2016/12/07 PHP
Yii框架分页实现方法详解
2017/05/20 PHP
Array.prototype.concat不是通用方法反驳[译]
2012/09/20 Javascript
Extjs4 GridPanel的主要配置参数详细介绍
2013/04/18 Javascript
jquery选择器之属性过滤选择器详解
2014/01/27 Javascript
jquery-tips悬浮提示插件分享
2015/07/31 Javascript
jQuery实现的简洁下拉菜单导航效果代码
2015/08/26 Javascript
为Jquery EasyUI 组件加上清除功能的方法(详解)
2017/04/13 jQuery
详解用node-images 打造简易图片服务器
2017/05/08 Javascript
Cropper.js 实现裁剪图片并上传(PC端)
2017/08/20 Javascript
响应式框架Bootstrap栅格系统的实例
2017/12/19 Javascript
VUE预渲染及遇到的坑
2018/09/03 Javascript
Nuxt.js实现一个SSR的前端博客的示例代码
2019/09/06 Javascript
Python写的创建文件夹自定义函数mkdir()
2014/08/25 Python
Python引用计数操作示例
2018/08/23 Python
浅析python3字符串格式化format()函数的简单用法
2018/12/07 Python
Python分支语句与循环语句应用实例分析
2019/05/07 Python
Python使用numpy模块实现矩阵和列表的连接操作方法
2019/06/26 Python
在Python函数中输入任意数量参数的实例
2019/07/16 Python
python 递归调用返回None的问题及解决方法
2020/03/16 Python
python如何使用代码运行助手
2020/07/03 Python
Python hashlib和hmac模块使用方法解析
2020/12/08 Python
html5页面结构_动力节点Java学院整理
2017/07/10 HTML / CSS
Superdry瑞典官网:英国日本街头风品牌
2017/05/17 全球购物
美国最大的网络男装服装品牌:Bonobos
2017/05/25 全球购物
品质主管的岗位职责
2013/12/04 职场文书
关于环保的标语
2014/06/13 职场文书
校园广播稿精选
2014/10/01 职场文书
后进基层党组织整改方案
2014/10/25 职场文书
2015年度个人业务工作总结
2015/04/27 职场文书
2016师德师风学习心得体会
2016/01/12 职场文书
导游词之新疆-喀纳斯
2019/10/10 职场文书
mysql定时自动备份数据库的方法步骤
2021/07/07 MySQL