编程 Python

Python3爬取英雄联盟英雄皮肤大图实例代码

Posted in Python onNovember 14, 2018

爬虫思路

初步尝试

我先查看了network，并没有发现有可用的API；然后又用bs4去分析英雄列表页，但是请求到html里面，并没有英雄列表，在英雄列表的节点上，只有“正在加载中”这样的字样；同样的方法，分析英雄详情也是这种情况，所以我猜测，这些数据应该是Javascript负责加载的。

继续尝试

然后我就查看了英雄列表的源代码，查看外部引入的js文件，以及行内的js脚本，大概在368行，发现了有处理英雄列表的js注释，然后继续往下读这些代码，发现了第一个彩蛋，也就是他引入了一个champion.js的文件，我猜测，这个应该就是英雄列表大全了，然后我打开了这个链接的js，一眼看过去，黑麻麻一片，然后格式化了一下压缩的js，确定这就是英雄列表的js数据文件了。

Python3爬取英雄联盟英雄皮肤大图实例代码

接着尝试

前面通过查看列表的源代码，找到了英雄列表的js数据文件，那么，我继续随机点开了一个英雄的详情，然后查看英雄详情源代码，然后大概在568行看到有一个showSkin的js方法，通过这里，发现了第二个彩蛋，也就是皮肤图片的URL地址拼接方法。

Python3爬取英雄联盟英雄皮肤大图实例代码

最后尝试

上面找到了皮肤图片URL的拼接方法，并且发现了一行很关键的代码 var skin =LOLherojs.champion[heroid].data.skins ，也就是，这个skin变量，就是英雄皮肤的所有图片数组，但是这个文件内，并没有LOLherojs这个变量，也就是外部引入的，所以，需要继续查看下面的源代码，找到引入这个变量的位置，果不其然，在757行，发现了最后一个彩蛋，也就是，英雄皮肤的js文件，通过这里可以知道，每个英雄都有一个单独的js文件，并且知道了这个js文件的URL拼接方法。

Python3爬取英雄联盟英雄皮肤大图实例代码

思路总结

通过上面的分析，我们就得到了爬取LOL皮肤图片的所有数据准备了，也就是，直接，只需要提取js中的英雄列表以及英雄详情数据，就可实现我们的需求了。下面是运行后抓取到的图片……

Python3爬取英雄联盟英雄皮肤大图实例代码

运行环境

Python运行环境：python3.6

用到的模块：requests、json、urllib、os

未安装的模块，请使用pip instatll进行安装，例如：pip install requests

完整代码

其他啥的废话就不多说了，直接上完整代码，有问题，直接留言给我就行，另外，代码已上传 GitHub 。再说明一下，那些有问题的英雄详情的js文件，大家有时间也可以琢磨下，或者有其他的更加快捷的爬取这些图片的方法，也可以拿出来交流和讨论，谢谢。

#!/usr/bin/env python
# -*- coding: utf-8 -*-
"""
抓取英雄联盟英雄全皮肤
author: gxcuizy
date: 2018-11-13
"""
import requests
import json
from urllib import parse
import os
class GetLolSkin(object):
  """抓取LOL英雄皮肤"""
  def __init__(self):
    """初始化变量"""
    self.hero_url = 'https://lol.qq.com/biz/hero/champion.js'
    self.hero_detail_url = 'http://lol.qq.com/biz/hero/'
    self.skin_folder = 'skin'
    self.skin_url = 'https://ossweb-img.qq.com/images/lol/web201310/skin/big'
  @staticmethod
  def get_html(url):
    """下载html"""
    request = requests.get(url)
    request.encoding = 'gbk'
    if request.status_code == 200:
      return request.text
    else:
      return "{}"
  def get_hero_list(self):
    """获取英雄的完整信息列表"""
    hero_js = self.get_html(self.hero_url)
    # 删除左右的多余信息，得到json数据
    out_left = "if(!LOLherojs)var LOLherojs={};LOLherojs.champion="
    out_right = ';'
    hero_list = hero_js.replace(out_left, '').rstrip(out_right)
    return json.loads(hero_list)
  def get_hero_info(self, hero_id):
    """获取英雄的详细信息"""
    # 获取js详情
    detail_url = parse.urljoin(self.hero_detail_url, hero_id + '.js')
    detail_js = self.get_html(detail_url)
    # 删除左右的多余信息，得到json数据
    out_left = "if(!herojs)var herojs={champion:{}};herojs['champion'][%s]=" % hero_id
    out_right = ';'
    hero_info = detail_js.replace(out_left, '').rstrip(out_right)
    return json.loads(hero_info)
  def download_skin_list(self, skin_list, hero_name):
    """下载皮肤列表"""
    # 循环下载皮肤
    for skin_info in skin_list:
      # 拼接图片名字
      if skin_info['name'] == 'default':
        skin_name = '默认皮肤'
      else:
        if ' ' in skin_info['name']:
          name_info = skin_info['name'].split(' ')
          skin_name = name_info[0]
        else:
          skin_name = skin_info['name']
      hero_skin_name = hero_name + '-' + skin_name + '.jpg'
      self.download_skin(skin_info['id'], hero_skin_name)
  def download_skin(self, skin_id, skin_name):
    """下载皮肤图片"""
    # 下载图片
    img_url = self.skin_url + skin_id + '.jpg'
    request = requests.get(img_url)
    if request.status_code == 200:
      print('downloading……%s' % skin_name)
      img_path = os.path.join(self.skin_folder, skin_name)
      with open(img_path, 'wb') as img:
        img.write(request.content)
    else:
      print('img error!')
  def make_folder(self):
    """初始化，创建图片文件夹"""
    if not os.path.exists(self.skin_folder):
      os.mkdir(self.skin_folder)
  def run(self):
    # 获取英雄列表信息
    hero_json = self.get_hero_list()
    hero_keys = hero_json['keys']
    # 循环遍历英雄
    for hero_id, hero_code in hero_keys.items():
      hero_name = hero_json['data'][hero_code]['name']
      hero_info = self.get_hero_info(hero_id)
      if hero_info:
        skin_list = hero_info['result'][hero_id]['skins']
        # 下载皮肤
        self.download_skin_list(skin_list, hero_name)
      else:
        print('英雄【%s】的皮肤获取有问题……' % hero_name)
# 程序执行入口
if __name__ == '__main__':
  lol = GetLolSkin()
  # 创建图片存储文件
  lol.make_folder()
  # 执行脚本
  lol.run()

总结

以上所述是小编给大家介绍的Python3爬取英雄联盟英雄皮肤大图实例代码，希望对大家有所帮助，如果大家有任何疑问请给我留言，小编会及时回复大家的。在此也非常感谢大家对三水点靠木网站的支持！

Python3爬取英雄联盟英雄皮肤大图实例代码

- Author -

gxcuizy

声明：登载此文出于传递更多信息之目的，并不意味着赞同其观点或证实其描述。

Python 相关文章推荐

python网络爬虫采集联想词示例

Feb 11 Python

Python3基础之输入和输出实例分析

Aug 18 Python

Python中的进程分支fork和exec详解

Apr 11 Python

python通过socket查询whois的方法

Jul 18 Python

Python安装lz4-0.10.1遇到的坑

May 20 Python

详解用python自制微信机器人，定时发送天气预报

Mar 25 Python

在django中,关于session的通用设置方法

Aug 06 Python

画pytorch模型图,以及参数计算的方法

Aug 17 Python

python中设置超时跳过,超时退出的方式

Dec 13 Python

如何基于python实现画不同品种的樱花树

Jan 03 Python

python等差数列求和公式前 100 项的和实例

Feb 25 Python

手残删除python之后的补救方法

Jun 26 Python

python 顺时针打印矩阵的超简洁代码

Nov 14 #Python

Python 实现取矩阵的部分列,保存为一个新的矩阵方法

Nov 14 #Python

Python实现常见的回文字符串算法

Nov 14 #Python

Python 单元测试（unittest）的使用小结

Nov 14 #Python

python for循环输入一个矩阵的实例

Nov 14 #Python

python获取中文字符串长度的方法

Nov 14 #Python

对python插入数据库和生成插入sql的示例讲解

Nov 14 #Python

You might like

php抓取页面的几种方法详解

2013/06/17 PHP

curl 出现错误的调试方法(必看)

2017/02/13 PHP

PHP字符串中抽取子串操作实例分析

2019/06/22 PHP

JavaScript 序列化对象实现代码

2009/12/18 Javascript

jQeury淡入淡出需要注意的问题

2010/09/08 Javascript

jQuery.get、jQuery.getJSON、jQuery.post无法返回JSON问题的解决方法

2011/07/28 Javascript

js修改地址栏URL参数解决url参数问题

2012/12/15 Javascript

js复制到剪切板的实例方法

2013/06/28 Javascript

完美实现仿QQ空间评论回复特效

2015/05/06 Javascript

jquery动画效果学习笔记（8种效果）

2015/11/13 Javascript

javascript下使用Promise封装FileReader

2016/02/19 Javascript

JavaScript实现数组降维详解

2017/01/05 Javascript

Vue报错：Uncaught TypeError: Cannot assign to read only property’exports‘ of object’#‘的解决方法

2017/06/17 Javascript

JavaScript 基础表单验证示例(纯Js实现)

2017/07/20 Javascript

关于vue.js发布后路径引用的问题解决

2017/08/15 Javascript

基于Vue实现拖拽功能

2020/07/29 Javascript

vuex 实现getter值赋值给vue组件里的data示例

2019/11/05 Javascript

微信小程序开发数据缓存基础知识辨析及运用实例详解

2020/11/06 Javascript

跟老齐学Python之有容乃大的list(1)

2014/09/14 Python

跟老齐学Python之有容乃大的list(3)

2014/09/15 Python

Linux CentOS Python开发环境搭建教程

2018/11/28 Python

使用GitHub和Python实现持续部署的方法

2019/05/09 Python

如何使用Flask-Migrate拓展数据库表结构

2019/07/24 Python

Series和DataFrame使用简单入门

2019/11/13 Python

详解python如何引用包package

2020/06/07 Python

中邮全球便购：中国邮政速递物流

2017/03/04 全球购物

美国奢侈品购物平台：Orchard Mile

2018/05/02 全球购物

Oakley西班牙官方商店：太阳眼镜和男女运动服

2019/04/26 全球购物

大学四年学习的自我评价分享

2013/12/09 职场文书

优秀员工表扬信

2014/01/17 职场文书

员工培训邀请函

2014/02/02 职场文书

iPhone13 Pro外观确定，升级4800万镜头，4月20日发新品

2021/04/15 数码科技

pytorch 中autograd.grad()函数的用法说明

2021/05/12 Python

Jupyter notebook 不自动弹出网页的解决方案

2021/05/21 Python

MySQL 数据库范式化设计理论

2022/04/22 MySQL

基于Python实现西西成语接龙小助手

2022/08/05 Golang