python爬不同图片分别保存在不同文件夹中的实现


Posted in Python onApril 02, 2021

例如,爬取赵丽颖,赵本山,赵文卓,赵欢,赵日天的图片分别保存在赵丽颖,赵本山,赵文卓,赵欢,赵日天命名的文件夹中,

测试代码

python爬不同图片分别保存在不同文件夹中的实现

python爬不同图片分别保存在不同文件夹中的实现

别的图就不放了

import requests
import time
import os
# 请求头,伪装成浏览器
headers = {
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/53.0.2785.116 Safari/537.36'
}
# keyword = '云斑白条天牛' # 关键字
keywords = ['赵丽颖','赵本山','赵文卓','赵欢','赵日天']
max_page = 2
i=1 # 记录图片数
for keyword in keywords:
  
  os.makedirs(keyword)
  for page in range(1,max_page):
    page = page*30
    # 网址
    url = 'https://image.baidu.com/search/acjson?tn=resultjson_com&ipn=rj&ct=201326592&is=&fp=result&queryWord='\
        +keyword+'&cl=2&lm=-1&ie=utf-8&oe=utf-8&adpicid=&st=-1&z=&ic=0&hd=&latest=&copyright=&word='\
        +keyword+'&s=&se=&tab=&width=&height=&face=0&istype=2&qc=&nc=1&fr=&expermode=&force=&cg=wallpaper&pn='\
        +str(page)+'&rn=30&gsm=1e&1596899786625='
    # 请求响应
    response = requests.get(url=url,headers=headers)
    # 得到相应的json数据
    json = response.json()
    if json.get('data'):
      for item in json.get('data')[:30]:
        # 图片地址
        img_url = item.get('thumbURL')
        # 获取图片
        image = requests.get(url=img_url)
        # 下载图片
        newstr = './'+keyword+'/'+str(i)+'.jpg'
        # with open('./%s/%d.jpg'%keywords ,%i,'wb') as f:
        with open(newstr,'wb') as f:
          f.write(image.content) # 图片二进制数据
        time.sleep(1) # 等待1s
        print('第%d张%s图片下载完成...'%(i,keyword))
        i+=1
print('End!')

你要修改的参数

将你想要爬的数据填入keywords 数组中即可

# 这里放你要查询的数组
keywords = ['','','',']

max_page是爬取百度图片的页数,一页是30张,这里写2的话就能爬30张,3能爬60张,以此类推

max_page = 3

你要的代码

代码如下:

import requests
import time
import os
# 请求头,伪装成浏览器
headers = {
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/53.0.2785.116 Safari/537.36'
}
# 这里放你要查询的数组
keywords = ['','','',']
max_page = 4
i=1 # 记录图片数
for keyword in keywords:
  
  os.makedirs(keyword)
  for page in range(1,max_page):
    page = page*30
    # 网址
    url = 'https://image.baidu.com/search/acjson?tn=resultjson_com&ipn=rj&ct=201326592&is=&fp=result&queryWord='\
        +keyword+'&cl=2&lm=-1&ie=utf-8&oe=utf-8&adpicid=&st=-1&z=&ic=0&hd=&latest=&copyright=&word='\
        +keyword+'&s=&se=&tab=&width=&height=&face=0&istype=2&qc=&nc=1&fr=&expermode=&force=&cg=wallpaper&pn='\
        +str(page)+'&rn=30&gsm=1e&1596899786625='
    # 请求响应
    response = requests.get(url=url,headers=headers)
    # 得到相应的json数据
    json = response.json()
    if json.get('data'):
      for item in json.get('data')[:30]:
        # 图片地址
        img_url = item.get('thumbURL')
        # 获取图片
        image = requests.get(url=img_url)
        # 下载图片
        newstr = './'+keyword+'/'+str(i)+'.jpg'
        # with open('./%s/%d.jpg'%keywords ,%i,'wb') as f:
        with open(newstr,'wb') as f:
          f.write(image.content) # 图片二进制数据
        time.sleep(1) # 等待1s
        print('第%d张%s图片下载完成...'%(i,keyword))
        i+=1  
print('End!')

到此这篇关于python爬不同图片分别保存在不同文件夹中的实现的文章就介绍到这了,更多相关python爬图片保存不同文件夹内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
用Python制作在地图上模拟瘟疫扩散的Gif图
Mar 31 Python
Python反射用法实例简析
Dec 22 Python
利用TensorFlow训练简单的二分类神经网络模型的方法
Mar 05 Python
解读python如何实现决策树算法
Oct 11 Python
使用python将图片格式转换为ico格式的示例
Oct 22 Python
对Python实现累加函数的方法详解
Jan 23 Python
pymongo中聚合查询的使用方法
Mar 22 Python
使用apiDoc实现python接口文档编写
Nov 19 Python
Python基于百度AI实现OCR文字识别
Apr 02 Python
如何用Matplotlib 画三维图的示例代码
Jul 28 Python
Python‘==‘ 及 ‘is‘相关原理解析
Sep 05 Python
Python 用户输入和while循环的操作
May 23 Python
Python读取文件夹下的所有文件实例代码
如何用python识别滑块验证码中的缺口
python 实现定时任务的四种方式
Apr 01 #Python
python读取pdf格式文档的实现代码
Python中使用Lambda函数的5种用法
Apr 01 #Python
python 实现mysql自动增删分区的方法
Apr 01 #Python
pygame面向对象的飞行小鸟实现(Flappy bird)
You might like
PHP 网页过期时间的控制代码
2009/06/29 PHP
php连接oracle数据库的方法(测试成功)
2016/05/26 PHP
PHP让网站移动访问更加友好方法
2019/02/14 PHP
JavaScript Event学习第二章 Event浏览器兼容性
2010/02/07 Javascript
写自已的js类库需要的核心代码
2012/07/16 Javascript
JS实现字体选色板实例代码
2013/11/20 Javascript
网站繁简切换的JS遇到页面卡死的解决方法
2014/03/12 Javascript
js怎么判断flash swf文件是否加载完毕
2014/08/14 Javascript
jQuery插件简单学习实例教程
2016/07/01 Javascript
jquery实现界面无刷新加载登陆注册
2016/07/30 Javascript
js设置文字颜色的方法示例
2016/12/30 Javascript
jquery mobile移动端幻灯片滑动切换效果
2020/04/15 Javascript
Vue.js项目部署到服务器的详细步骤
2017/07/17 Javascript
React Native之ListView实现九宫格效果的示例
2017/08/02 Javascript
Vue实现数字输入框中分割手机号码的示例
2017/10/10 Javascript
ES6扩展运算符用法实例分析
2017/10/31 Javascript
WebPack配置vue多页面的技巧
2018/05/15 Javascript
Vue项目路由刷新的实现代码
2019/04/17 Javascript
js设置默认时间跨度过程详解
2019/07/17 Javascript
Nuxt的路由动画效果案例
2020/11/06 Javascript
如何使用 vue-cli 创建模板项目
2020/11/19 Vue.js
Python Requests安装与简单运用
2016/04/07 Python
python版本五子棋的实现代码
2018/12/11 Python
Python3中编码与解码之Unicode与bytes的讲解
2019/02/28 Python
python爬虫实例之获取动漫截图
2020/05/31 Python
3D动画《斗罗大陆》上线当日播放过亿
2021/03/16 国漫
双立人加拿大官网:Zwilling加拿大
2020/08/10 全球购物
顺丰快递Java软件工程师面试题
2015/07/31 面试题
社区工作感言
2014/02/21 职场文书
企业元宵节主持词
2014/03/25 职场文书
党员干部承诺书
2014/03/25 职场文书
银行委托书范本
2014/09/28 职场文书
党员教师群众路线对照检查材料思想汇报
2014/09/29 职场文书
放弃继承权公证书
2015/01/23 职场文书
2019邀请函格式及范文
2019/05/20 职场文书
导游词之任弼时故居
2020/01/07 职场文书