python爬不同图片分别保存在不同文件夹中的实现


Posted in Python onApril 02, 2021

例如,爬取赵丽颖,赵本山,赵文卓,赵欢,赵日天的图片分别保存在赵丽颖,赵本山,赵文卓,赵欢,赵日天命名的文件夹中,

测试代码

python爬不同图片分别保存在不同文件夹中的实现

python爬不同图片分别保存在不同文件夹中的实现

别的图就不放了

import requests
import time
import os
# 请求头,伪装成浏览器
headers = {
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/53.0.2785.116 Safari/537.36'
}
# keyword = '云斑白条天牛' # 关键字
keywords = ['赵丽颖','赵本山','赵文卓','赵欢','赵日天']
max_page = 2
i=1 # 记录图片数
for keyword in keywords:
  
  os.makedirs(keyword)
  for page in range(1,max_page):
    page = page*30
    # 网址
    url = 'https://image.baidu.com/search/acjson?tn=resultjson_com&ipn=rj&ct=201326592&is=&fp=result&queryWord='\
        +keyword+'&cl=2&lm=-1&ie=utf-8&oe=utf-8&adpicid=&st=-1&z=&ic=0&hd=&latest=&copyright=&word='\
        +keyword+'&s=&se=&tab=&width=&height=&face=0&istype=2&qc=&nc=1&fr=&expermode=&force=&cg=wallpaper&pn='\
        +str(page)+'&rn=30&gsm=1e&1596899786625='
    # 请求响应
    response = requests.get(url=url,headers=headers)
    # 得到相应的json数据
    json = response.json()
    if json.get('data'):
      for item in json.get('data')[:30]:
        # 图片地址
        img_url = item.get('thumbURL')
        # 获取图片
        image = requests.get(url=img_url)
        # 下载图片
        newstr = './'+keyword+'/'+str(i)+'.jpg'
        # with open('./%s/%d.jpg'%keywords ,%i,'wb') as f:
        with open(newstr,'wb') as f:
          f.write(image.content) # 图片二进制数据
        time.sleep(1) # 等待1s
        print('第%d张%s图片下载完成...'%(i,keyword))
        i+=1
print('End!')

你要修改的参数

将你想要爬的数据填入keywords 数组中即可

# 这里放你要查询的数组
keywords = ['','','',']

max_page是爬取百度图片的页数,一页是30张,这里写2的话就能爬30张,3能爬60张,以此类推

max_page = 3

你要的代码

代码如下:

import requests
import time
import os
# 请求头,伪装成浏览器
headers = {
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/53.0.2785.116 Safari/537.36'
}
# 这里放你要查询的数组
keywords = ['','','',']
max_page = 4
i=1 # 记录图片数
for keyword in keywords:
  
  os.makedirs(keyword)
  for page in range(1,max_page):
    page = page*30
    # 网址
    url = 'https://image.baidu.com/search/acjson?tn=resultjson_com&ipn=rj&ct=201326592&is=&fp=result&queryWord='\
        +keyword+'&cl=2&lm=-1&ie=utf-8&oe=utf-8&adpicid=&st=-1&z=&ic=0&hd=&latest=&copyright=&word='\
        +keyword+'&s=&se=&tab=&width=&height=&face=0&istype=2&qc=&nc=1&fr=&expermode=&force=&cg=wallpaper&pn='\
        +str(page)+'&rn=30&gsm=1e&1596899786625='
    # 请求响应
    response = requests.get(url=url,headers=headers)
    # 得到相应的json数据
    json = response.json()
    if json.get('data'):
      for item in json.get('data')[:30]:
        # 图片地址
        img_url = item.get('thumbURL')
        # 获取图片
        image = requests.get(url=img_url)
        # 下载图片
        newstr = './'+keyword+'/'+str(i)+'.jpg'
        # with open('./%s/%d.jpg'%keywords ,%i,'wb') as f:
        with open(newstr,'wb') as f:
          f.write(image.content) # 图片二进制数据
        time.sleep(1) # 等待1s
        print('第%d张%s图片下载完成...'%(i,keyword))
        i+=1  
print('End!')

到此这篇关于python爬不同图片分别保存在不同文件夹中的实现的文章就介绍到这了,更多相关python爬图片保存不同文件夹内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
python根据日期返回星期几的方法
Jul 06 Python
python dict.get()和dict['key']的区别详解
Jun 30 Python
Python合并字典键值并去除重复元素的实例
Dec 18 Python
Java编程迭代地删除文件夹及其下的所有文件实例
Feb 10 Python
Flask框架使用DBUtils模块连接数据库操作示例
Jul 20 Python
Python使用post及get方式提交数据的实例
Jan 24 Python
Python列表切片常用操作实例解析
Dec 16 Python
PyQt5中多线程模块QThread使用方法的实现
Jan 31 Python
安装完Python包然后找不到模块的解决步骤
Feb 13 Python
django跳转页面传参的实现
Sep 17 Python
opencv python 对指针仪表读数识别的两种方式
Jan 14 Python
Python中的流程控制详解
Feb 18 Python
Python读取文件夹下的所有文件实例代码
如何用python识别滑块验证码中的缺口
python 实现定时任务的四种方式
Apr 01 #Python
python读取pdf格式文档的实现代码
Python中使用Lambda函数的5种用法
Apr 01 #Python
python 实现mysql自动增删分区的方法
Apr 01 #Python
pygame面向对象的飞行小鸟实现(Flappy bird)
You might like
php 网页游戏开发入门教程一(webgame+design)
2009/10/26 PHP
php防注入,表单提交值转义的实现详解
2013/06/10 PHP
Redis使用Eval多个键值自增的操作实例
2016/11/04 PHP
php 截取中英文混合字符串的方法
2018/05/31 PHP
js脚本学习 比较实用的基础
2006/09/07 Javascript
Ubuntu 11.10 安装Node.js的方法
2011/11/30 Javascript
讨论html与javascript在浏览器中的加载顺序问题
2013/11/27 Javascript
JavaScript移除数组内重复元素的方法
2015/03/18 Javascript
JavaScript 事件绑定及深入
2015/04/13 Javascript
javascript引用类型之时间Date和数组Array
2015/08/27 Javascript
JavaScript function函数种类详解
2016/02/22 Javascript
关于List.ToArray()方法的效率测试
2016/09/30 Javascript
前端 Vue.js 和 MVVM 详细介绍
2016/12/29 Javascript
JS+CSS实现下拉刷新/上拉加载插件
2017/03/31 Javascript
js轮播图透明度切换(带上下页和底部圆点切换)
2017/04/27 Javascript
p5.js入门教程之鼠标交互的示例
2018/03/16 Javascript
koa上传excel文件并解析的实现方法
2018/08/09 Javascript
angularJs复选框checkbox选中进行ng-show显示隐藏的方法
2018/10/08 Javascript
React+Antd+Redux实现待办事件的方法
2019/03/14 Javascript
vue实现前端列表多条件筛选
2020/10/26 Javascript
js 实现碰撞检测的示例
2020/10/28 Javascript
Python进行数据提取的方法总结
2016/08/22 Python
Python3实现获取图片文字里中文的方法分析
2018/12/13 Python
python中的&&及||的实现示例
2019/08/07 Python
python 直接赋值和copy的区别详解
2019/08/07 Python
Python编程快速上手——strip()函数的正则表达式实现方法分析
2020/02/29 Python
pandas分组聚合详解
2020/04/10 Python
解决python 执行sql语句时所传参数含有单引号的问题
2020/06/06 Python
matplotlib绘制鼠标的十字光标的实现(内置方式)
2021/01/06 Python
CSS3 @keyframes简单动画实现
2018/02/24 HTML / CSS
大学生学年个人总结
2015/02/15 职场文书
安全生产先进个人总结
2015/02/15 职场文书
Nginx工作原理和优化总结。
2021/04/02 Servers
Js类的构建与继承案例详解
2021/09/15 Javascript
《巫师》是美食游戏?CDPR10月将推出《巫师》官方食谱
2022/04/03 其他游戏
Ruby处理YAML和json数据
2022/04/18 Ruby