python爬不同图片分别保存在不同文件夹中的实现


Posted in Python onApril 02, 2021

例如,爬取赵丽颖,赵本山,赵文卓,赵欢,赵日天的图片分别保存在赵丽颖,赵本山,赵文卓,赵欢,赵日天命名的文件夹中,

测试代码

python爬不同图片分别保存在不同文件夹中的实现

python爬不同图片分别保存在不同文件夹中的实现

别的图就不放了

import requests
import time
import os
# 请求头,伪装成浏览器
headers = {
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/53.0.2785.116 Safari/537.36'
}
# keyword = '云斑白条天牛' # 关键字
keywords = ['赵丽颖','赵本山','赵文卓','赵欢','赵日天']
max_page = 2
i=1 # 记录图片数
for keyword in keywords:
  
  os.makedirs(keyword)
  for page in range(1,max_page):
    page = page*30
    # 网址
    url = 'https://image.baidu.com/search/acjson?tn=resultjson_com&ipn=rj&ct=201326592&is=&fp=result&queryWord='\
        +keyword+'&cl=2&lm=-1&ie=utf-8&oe=utf-8&adpicid=&st=-1&z=&ic=0&hd=&latest=&copyright=&word='\
        +keyword+'&s=&se=&tab=&width=&height=&face=0&istype=2&qc=&nc=1&fr=&expermode=&force=&cg=wallpaper&pn='\
        +str(page)+'&rn=30&gsm=1e&1596899786625='
    # 请求响应
    response = requests.get(url=url,headers=headers)
    # 得到相应的json数据
    json = response.json()
    if json.get('data'):
      for item in json.get('data')[:30]:
        # 图片地址
        img_url = item.get('thumbURL')
        # 获取图片
        image = requests.get(url=img_url)
        # 下载图片
        newstr = './'+keyword+'/'+str(i)+'.jpg'
        # with open('./%s/%d.jpg'%keywords ,%i,'wb') as f:
        with open(newstr,'wb') as f:
          f.write(image.content) # 图片二进制数据
        time.sleep(1) # 等待1s
        print('第%d张%s图片下载完成...'%(i,keyword))
        i+=1
print('End!')

你要修改的参数

将你想要爬的数据填入keywords 数组中即可

# 这里放你要查询的数组
keywords = ['','','',']

max_page是爬取百度图片的页数,一页是30张,这里写2的话就能爬30张,3能爬60张,以此类推

max_page = 3

你要的代码

代码如下:

import requests
import time
import os
# 请求头,伪装成浏览器
headers = {
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/53.0.2785.116 Safari/537.36'
}
# 这里放你要查询的数组
keywords = ['','','',']
max_page = 4
i=1 # 记录图片数
for keyword in keywords:
  
  os.makedirs(keyword)
  for page in range(1,max_page):
    page = page*30
    # 网址
    url = 'https://image.baidu.com/search/acjson?tn=resultjson_com&ipn=rj&ct=201326592&is=&fp=result&queryWord='\
        +keyword+'&cl=2&lm=-1&ie=utf-8&oe=utf-8&adpicid=&st=-1&z=&ic=0&hd=&latest=&copyright=&word='\
        +keyword+'&s=&se=&tab=&width=&height=&face=0&istype=2&qc=&nc=1&fr=&expermode=&force=&cg=wallpaper&pn='\
        +str(page)+'&rn=30&gsm=1e&1596899786625='
    # 请求响应
    response = requests.get(url=url,headers=headers)
    # 得到相应的json数据
    json = response.json()
    if json.get('data'):
      for item in json.get('data')[:30]:
        # 图片地址
        img_url = item.get('thumbURL')
        # 获取图片
        image = requests.get(url=img_url)
        # 下载图片
        newstr = './'+keyword+'/'+str(i)+'.jpg'
        # with open('./%s/%d.jpg'%keywords ,%i,'wb') as f:
        with open(newstr,'wb') as f:
          f.write(image.content) # 图片二进制数据
        time.sleep(1) # 等待1s
        print('第%d张%s图片下载完成...'%(i,keyword))
        i+=1  
print('End!')

到此这篇关于python爬不同图片分别保存在不同文件夹中的实现的文章就介绍到这了,更多相关python爬图片保存不同文件夹内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
Python使用matplotlib绘图无法显示中文问题的解决方法
Mar 14 Python
Python Selenium Cookie 绕过验证码实现登录示例代码
Apr 10 Python
儿童编程python入门
May 08 Python
python3实现多线程聊天室
Dec 12 Python
在scrapy中使用phantomJS实现异步爬取的方法
Dec 17 Python
python异步存储数据详解
Mar 19 Python
详解Python的三种可变参数
May 08 Python
Python之Matplotlib文字与注释的使用方法
Jun 18 Python
python如何实现读取并显示图片(不需要图形界面)
Jul 08 Python
基于OpenCV的网络实时视频流传输的实现
Nov 15 Python
python通配符之glob模块的使用详解
Apr 24 Python
python和anaconda的区别
May 06 Python
Python读取文件夹下的所有文件实例代码
如何用python识别滑块验证码中的缺口
python 实现定时任务的四种方式
Apr 01 #Python
python读取pdf格式文档的实现代码
Python中使用Lambda函数的5种用法
Apr 01 #Python
python 实现mysql自动增删分区的方法
Apr 01 #Python
pygame面向对象的飞行小鸟实现(Flappy bird)
You might like
PHP基础知识介绍
2013/09/17 PHP
jQuery中文入门指南,翻译加实例,jQuery的起点教程
2007/01/13 Javascript
不使用XMLHttpRequest实现异步加载 Iframe和script
2012/10/29 Javascript
在javascript中对于DOM的加强
2013/04/11 Javascript
nodejs文件操作模块FS(File System)常用函数简明总结
2014/06/05 NodeJs
Javascript数据结构与算法之列表详解
2015/03/12 Javascript
jQuery插件slides实现无缝轮播图特效
2015/04/17 Javascript
jQuery滚动新闻实现代码
2016/06/26 Javascript
jquery实现超简单的瀑布流布局【推荐】
2017/03/08 Javascript
jquery mobile实现可折叠的导航按钮
2017/03/11 Javascript
带你了解session和cookie作用原理区别和用法
2017/08/14 Javascript
微信小程序实现换肤功能
2018/03/14 Javascript
JavaScript 正则命名分组【推荐】
2018/06/07 Javascript
使用electron将vue-cli项目打包成exe的方法
2018/09/29 Javascript
javascript设计模式 ? 单例模式原理与应用实例分析
2020/04/09 Javascript
JavaScript 引用类型实例详解【数组、对象、严格模式等】
2020/05/13 Javascript
vue 导航锚点_点击平滑滚动,导航栏对应变化详解
2020/08/10 Javascript
JavaScript实现手风琴效果
2021/02/18 Javascript
Python黑帽编程 3.4 跨越VLAN详解
2016/09/28 Python
对tf.reduce_sum tensorflow维度上的操作详解
2018/07/26 Python
python实现三维拟合的方法
2018/12/29 Python
Python中的Socket 与 ScoketServer 通信及遇到问题解决方法
2019/04/01 Python
python图像处理入门(一)
2019/04/04 Python
Django学习笔记之为Model添加Action
2019/04/30 Python
python sorted方法和列表使用解析
2019/11/18 Python
Canvas 文本转粒子效果的实现代码
2019/02/14 HTML / CSS
财务会计实习报告体会
2013/12/20 职场文书
公证委托书大全
2014/04/04 职场文书
医药公司采购员岗位职责
2014/09/12 职场文书
党员批评与自我批评思想汇报(集锦)
2014/09/14 职场文书
乡镇一岗双责责任书
2015/01/29 职场文书
灵山大佛导游词
2015/02/04 职场文书
2015年入党决心书
2015/02/05 职场文书
水电工岗位职责
2015/02/14 职场文书
党校毕业个人总结
2015/02/28 职场文书
话题作文之生命的旋律
2019/12/17 职场文书