python爬不同图片分别保存在不同文件夹中的实现


Posted in Python onApril 02, 2021

例如,爬取赵丽颖,赵本山,赵文卓,赵欢,赵日天的图片分别保存在赵丽颖,赵本山,赵文卓,赵欢,赵日天命名的文件夹中,

测试代码

python爬不同图片分别保存在不同文件夹中的实现

python爬不同图片分别保存在不同文件夹中的实现

别的图就不放了

import requests
import time
import os
# 请求头,伪装成浏览器
headers = {
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/53.0.2785.116 Safari/537.36'
}
# keyword = '云斑白条天牛' # 关键字
keywords = ['赵丽颖','赵本山','赵文卓','赵欢','赵日天']
max_page = 2
i=1 # 记录图片数
for keyword in keywords:
  
  os.makedirs(keyword)
  for page in range(1,max_page):
    page = page*30
    # 网址
    url = 'https://image.baidu.com/search/acjson?tn=resultjson_com&ipn=rj&ct=201326592&is=&fp=result&queryWord='\
        +keyword+'&cl=2&lm=-1&ie=utf-8&oe=utf-8&adpicid=&st=-1&z=&ic=0&hd=&latest=&copyright=&word='\
        +keyword+'&s=&se=&tab=&width=&height=&face=0&istype=2&qc=&nc=1&fr=&expermode=&force=&cg=wallpaper&pn='\
        +str(page)+'&rn=30&gsm=1e&1596899786625='
    # 请求响应
    response = requests.get(url=url,headers=headers)
    # 得到相应的json数据
    json = response.json()
    if json.get('data'):
      for item in json.get('data')[:30]:
        # 图片地址
        img_url = item.get('thumbURL')
        # 获取图片
        image = requests.get(url=img_url)
        # 下载图片
        newstr = './'+keyword+'/'+str(i)+'.jpg'
        # with open('./%s/%d.jpg'%keywords ,%i,'wb') as f:
        with open(newstr,'wb') as f:
          f.write(image.content) # 图片二进制数据
        time.sleep(1) # 等待1s
        print('第%d张%s图片下载完成...'%(i,keyword))
        i+=1
print('End!')

你要修改的参数

将你想要爬的数据填入keywords 数组中即可

# 这里放你要查询的数组
keywords = ['','','',']

max_page是爬取百度图片的页数,一页是30张,这里写2的话就能爬30张,3能爬60张,以此类推

max_page = 3

你要的代码

代码如下:

import requests
import time
import os
# 请求头,伪装成浏览器
headers = {
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/53.0.2785.116 Safari/537.36'
}
# 这里放你要查询的数组
keywords = ['','','',']
max_page = 4
i=1 # 记录图片数
for keyword in keywords:
  
  os.makedirs(keyword)
  for page in range(1,max_page):
    page = page*30
    # 网址
    url = 'https://image.baidu.com/search/acjson?tn=resultjson_com&ipn=rj&ct=201326592&is=&fp=result&queryWord='\
        +keyword+'&cl=2&lm=-1&ie=utf-8&oe=utf-8&adpicid=&st=-1&z=&ic=0&hd=&latest=&copyright=&word='\
        +keyword+'&s=&se=&tab=&width=&height=&face=0&istype=2&qc=&nc=1&fr=&expermode=&force=&cg=wallpaper&pn='\
        +str(page)+'&rn=30&gsm=1e&1596899786625='
    # 请求响应
    response = requests.get(url=url,headers=headers)
    # 得到相应的json数据
    json = response.json()
    if json.get('data'):
      for item in json.get('data')[:30]:
        # 图片地址
        img_url = item.get('thumbURL')
        # 获取图片
        image = requests.get(url=img_url)
        # 下载图片
        newstr = './'+keyword+'/'+str(i)+'.jpg'
        # with open('./%s/%d.jpg'%keywords ,%i,'wb') as f:
        with open(newstr,'wb') as f:
          f.write(image.content) # 图片二进制数据
        time.sleep(1) # 等待1s
        print('第%d张%s图片下载完成...'%(i,keyword))
        i+=1  
print('End!')

到此这篇关于python爬不同图片分别保存在不同文件夹中的实现的文章就介绍到这了,更多相关python爬图片保存不同文件夹内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
python sys模块sys.path使用方法示例
Dec 04 Python
python根据距离和时长计算配速示例
Feb 16 Python
使用Django的模版来配合字符串翻译工作
Jul 27 Python
python安装numpy&安装matplotlib& scipy的教程
Nov 02 Python
Python程序运行原理图文解析
Feb 10 Python
python 实现对文件夹内的文件排序编号
Apr 12 Python
python 时间信息“2018-02-04 18:23:35“ 解析成字典形式的结果代码详解
Apr 19 Python
Python使用Shelve保存对象方法总结
Jan 28 Python
为何人工智能(AI)首选Python?读完这篇文章你就知道了(推荐)
Apr 06 Python
python实现根据给定坐标点生成多边形mask的例子
Feb 18 Python
Python实现电视里的5毛特效实例代码详解
May 15 Python
Python通过递归函数输出嵌套列表元素
Oct 15 Python
Python读取文件夹下的所有文件实例代码
如何用python识别滑块验证码中的缺口
python 实现定时任务的四种方式
Apr 01 #Python
python读取pdf格式文档的实现代码
Python中使用Lambda函数的5种用法
Apr 01 #Python
python 实现mysql自动增删分区的方法
Apr 01 #Python
pygame面向对象的飞行小鸟实现(Flappy bird)
You might like
echo(),print(),print_r()之间的区别?
2006/11/19 PHP
php类常量的使用详解
2013/06/08 PHP
jquery checkbox,radio是否选中的判断代码
2010/03/20 Javascript
js返回前一页刷新本页重载页面
2014/07/29 Javascript
JavaScript中Cookie操作实例
2015/01/09 Javascript
jQuery插件实现大图全屏图片相册
2015/03/14 Javascript
JavaScript实现单击下拉框选择直接跳转页面的方法
2015/07/02 Javascript
浅析$(function) ready和onload 的区别
2016/09/03 Javascript
jQuery插件HighCharts绘制2D带Label的折线图效果示例【附demo源码下载】
2017/03/08 Javascript
详解HTTPS 的原理和 NodeJS 的实现
2017/07/04 NodeJs
实现高性能javascript的注意事项
2019/05/27 Javascript
浅谈Vue SSR中的Bundle的具有使用
2019/11/21 Javascript
JavaScript快速调试的两个技巧
2020/11/04 Javascript
[43:51]2014 DOTA2国际邀请赛中国区预选赛 Dream Times VS TongFu
2014/05/22 DOTA
[04:09]2014DOTA2国际邀请赛Ti西雅图 历届冠军相继出局 BBC综述今日比赛
2014/07/20 DOTA
Python中使用Queue和Condition进行线程同步的方法
2016/01/19 Python
使用Python的urllib2模块处理url和图片的技巧两则
2016/02/18 Python
浅谈django开发者模式中的autoreload是如何实现的
2017/08/18 Python
Python-copy()与deepcopy()区别详解
2019/07/12 Python
python3应用windows api对后台程序窗口及桌面截图并保存的方法
2019/08/27 Python
Python使用Slider组件实现调整曲线参数功能示例
2019/09/06 Python
python文件及目录操作代码汇总
2020/07/08 Python
电子商务毕业生求职信
2013/11/10 职场文书
人事主管的岗位职责
2013/11/16 职场文书
学生会主席竞聘书
2014/03/31 职场文书
创先争优标语
2014/06/27 职场文书
领导干部作风建设工作总结
2014/10/23 职场文书
反邪教警示教育活动总结
2015/05/09 职场文书
小学体育组工作总结2015
2015/07/21 职场文书
导游词书写之黄山
2019/08/06 职场文书
解决Swagger2返回map复杂结构不能解析的问题
2021/07/02 Java/Android
Java移除无效括号的方法实现
2021/08/07 Java/Android
使用Ajax实现进度条的绘制
2022/04/07 Javascript
Mysql中常用的join连接方式
2022/05/11 MySQL
JS前端监控采集用户行为的N种姿势
2022/07/23 Javascript
MySQL中LAG()函数和LEAD()函数的使用
2022/08/14 MySQL