python爬不同图片分别保存在不同文件夹中的实现


Posted in Python onApril 02, 2021

例如,爬取赵丽颖,赵本山,赵文卓,赵欢,赵日天的图片分别保存在赵丽颖,赵本山,赵文卓,赵欢,赵日天命名的文件夹中,

测试代码

python爬不同图片分别保存在不同文件夹中的实现

python爬不同图片分别保存在不同文件夹中的实现

别的图就不放了

import requests
import time
import os
# 请求头,伪装成浏览器
headers = {
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/53.0.2785.116 Safari/537.36'
}
# keyword = '云斑白条天牛' # 关键字
keywords = ['赵丽颖','赵本山','赵文卓','赵欢','赵日天']
max_page = 2
i=1 # 记录图片数
for keyword in keywords:
  
  os.makedirs(keyword)
  for page in range(1,max_page):
    page = page*30
    # 网址
    url = 'https://image.baidu.com/search/acjson?tn=resultjson_com&ipn=rj&ct=201326592&is=&fp=result&queryWord='\
        +keyword+'&cl=2&lm=-1&ie=utf-8&oe=utf-8&adpicid=&st=-1&z=&ic=0&hd=&latest=&copyright=&word='\
        +keyword+'&s=&se=&tab=&width=&height=&face=0&istype=2&qc=&nc=1&fr=&expermode=&force=&cg=wallpaper&pn='\
        +str(page)+'&rn=30&gsm=1e&1596899786625='
    # 请求响应
    response = requests.get(url=url,headers=headers)
    # 得到相应的json数据
    json = response.json()
    if json.get('data'):
      for item in json.get('data')[:30]:
        # 图片地址
        img_url = item.get('thumbURL')
        # 获取图片
        image = requests.get(url=img_url)
        # 下载图片
        newstr = './'+keyword+'/'+str(i)+'.jpg'
        # with open('./%s/%d.jpg'%keywords ,%i,'wb') as f:
        with open(newstr,'wb') as f:
          f.write(image.content) # 图片二进制数据
        time.sleep(1) # 等待1s
        print('第%d张%s图片下载完成...'%(i,keyword))
        i+=1
print('End!')

你要修改的参数

将你想要爬的数据填入keywords 数组中即可

# 这里放你要查询的数组
keywords = ['','','',']

max_page是爬取百度图片的页数,一页是30张,这里写2的话就能爬30张,3能爬60张,以此类推

max_page = 3

你要的代码

代码如下:

import requests
import time
import os
# 请求头,伪装成浏览器
headers = {
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/53.0.2785.116 Safari/537.36'
}
# 这里放你要查询的数组
keywords = ['','','',']
max_page = 4
i=1 # 记录图片数
for keyword in keywords:
  
  os.makedirs(keyword)
  for page in range(1,max_page):
    page = page*30
    # 网址
    url = 'https://image.baidu.com/search/acjson?tn=resultjson_com&ipn=rj&ct=201326592&is=&fp=result&queryWord='\
        +keyword+'&cl=2&lm=-1&ie=utf-8&oe=utf-8&adpicid=&st=-1&z=&ic=0&hd=&latest=&copyright=&word='\
        +keyword+'&s=&se=&tab=&width=&height=&face=0&istype=2&qc=&nc=1&fr=&expermode=&force=&cg=wallpaper&pn='\
        +str(page)+'&rn=30&gsm=1e&1596899786625='
    # 请求响应
    response = requests.get(url=url,headers=headers)
    # 得到相应的json数据
    json = response.json()
    if json.get('data'):
      for item in json.get('data')[:30]:
        # 图片地址
        img_url = item.get('thumbURL')
        # 获取图片
        image = requests.get(url=img_url)
        # 下载图片
        newstr = './'+keyword+'/'+str(i)+'.jpg'
        # with open('./%s/%d.jpg'%keywords ,%i,'wb') as f:
        with open(newstr,'wb') as f:
          f.write(image.content) # 图片二进制数据
        time.sleep(1) # 等待1s
        print('第%d张%s图片下载完成...'%(i,keyword))
        i+=1  
print('End!')

到此这篇关于python爬不同图片分别保存在不同文件夹中的实现的文章就介绍到这了,更多相关python爬图片保存不同文件夹内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
详细介绍Python语言中的按位运算符
Nov 26 Python
用Python的线程来解决生产者消费问题的示例
Apr 02 Python
Python通过DOM和SAX方式解析XML的应用实例分享
Nov 16 Python
Python实现的爬虫功能代码
Jun 24 Python
Python实现的朴素贝叶斯分类器示例
Jan 06 Python
Python 机器学习库 NumPy入门教程
Apr 19 Python
Python定义二叉树及4种遍历方法实例详解
Jul 05 Python
Python3数据库操作包pymysql的操作方法
Jul 16 Python
python多行字符串拼接使用小括号的方法
Mar 19 Python
完美解决python3.7 pip升级 拒绝访问问题
Jul 12 Python
关于python tushare Tkinter构建的简单股票可视化查询系统(Beta v0.13)
Oct 19 Python
BeautifulSoup获取指定class样式的div的实现
Dec 07 Python
Python读取文件夹下的所有文件实例代码
如何用python识别滑块验证码中的缺口
python 实现定时任务的四种方式
Apr 01 #Python
python读取pdf格式文档的实现代码
Python中使用Lambda函数的5种用法
Apr 01 #Python
python 实现mysql自动增删分区的方法
Apr 01 #Python
pygame面向对象的飞行小鸟实现(Flappy bird)
You might like
一个捕获函数输出的函数
2007/02/14 PHP
表单复选框向PHP传输数据的代码
2007/11/13 PHP
ThinkPHP的Widget扩展实例
2014/06/19 PHP
PHP IDE PHPStorm配置支持友好Laravel代码提示方法
2015/05/12 PHP
利用php_imagick实现复古效果的方法
2016/10/18 PHP
PHP-CGI远程代码执行漏洞分析与防范
2017/05/07 PHP
laravel通用化的CURD的实现
2019/12/13 PHP
基于jQuery的Spin Button自定义文本框数值自增或自减
2010/07/17 Javascript
探讨JavaScript中声明全局变量三种方式的异同
2013/12/03 Javascript
javascript使用shift+click实现选择和反选checkbox的方法
2015/05/04 Javascript
使用jquery+CSS3实现仿windows10开始菜单的下拉导航菜单特效
2015/09/24 Javascript
jquery实现表格隔行换色效果
2015/11/19 Javascript
浅析Javascript的自动分号插入(ASI)机制
2016/09/29 Javascript
Vue使用枚举类型实现HTML下拉框步骤详解
2018/02/05 Javascript
vue中beforeRouteLeave实现页面回退不刷新的示例代码
2019/11/01 Javascript
解决vue-cli@3.xx安装不成功的问题及搭建ts-vue项目
2020/02/09 Javascript
vue实现简单全选和反选功能
2020/09/15 Javascript
python抓取网页图片并放到指定文件夹
2014/04/24 Python
python使用wmi模块获取windows下的系统信息 监控系统
2015/10/27 Python
黑科技 Python脚本帮你找出微信上删除你好友的人
2016/01/07 Python
使用pyinstaller打包PyQt4程序遇到的问题及解决方法
2019/06/24 Python
python:按行读入,排序然后输出的方法
2019/07/20 Python
python nmap实现端口扫描器教程
2020/05/28 Python
Python 使用多属性来进行排序
2019/09/01 Python
Python tkinter三种布局实例详解
2020/01/06 Python
Pandas —— resample()重采样和asfreq()频度转换方式
2020/02/26 Python
appium+python adb常用命令分享
2020/03/06 Python
Python中zip函数如何使用
2020/06/04 Python
德国骆驼商店:ActiveFashionWorld
2017/11/18 全球购物
英国最专业的健身器材供应商之一:Best Gym Equipment
2017/12/22 全球购物
安全生产承诺书
2014/03/26 职场文书
学校政风行风评议工作总结
2014/10/21 职场文书
2014年纳税评估工作总结
2014/12/23 职场文书
Nginx的rewrite模块详解
2021/03/31 Servers
mysql批量新增和存储的方法实例
2021/04/07 MySQL
Windows server 2022创建创建林、域树、子域的步骤
2022/06/25 Servers