编程 Python

Python爬虫获取op.gg英雄联盟英雄对位胜率的源码

Posted in Python onJanuary 29, 2021

通过第三方BeautifulSoup库来爬取op.gg网页静态数据

主要思路

op.gg网站

网站以出场率高低排名，并且列出对位胜率，在高出场率的前提下，胜率有很大的参考意义，在counter位很有帮助

Python爬虫获取op.gg英雄联盟英雄对位胜率的源码

通过开发者工具找到对应部位源码，发现数据就在源码中，证明这是一个静态数据，确定使用BeautifulSoup库。

源码

import requests
from bs4 import BeautifulSoup

championname={'阿卡丽 ':'akali','牛头':'alistar','阿木木':'amumu','冰鸟':'anivia','安妮':'annie','艾希':'ashe','机器人':'blitzcrank','火男':'brand','女警':'caitlyn',
    '蛇女':'cassiopeia','大虫子':'chogath','飞机':'corki','诺手':'darius','皎月':'diana','蒙多':'drmundo','德莱文':'delevin','蜘蛛':'elise',
    '寡妇':'evelynn','ez':'ezreal','稻草人':'fiddlesticks','剑姬':'fiora','鱼人':'fizz','加里奥':'galio','船长':'gangplank','盖伦':'garen',
    '酒桶':'gragas','人马':'hecarim','大头':'heimerdinger','刀妹':'irelia','凤女':'janna','皇子':'jarvaniv','贾克斯':'jax','杰斯':'jayce','卡尔玛':'karma',
    '死歌':'karthus','卡萨丁':'kassadin','卡特':'katarina','天使':'kayle','凯南':'kennen','螳螂':'khazix','大嘴':'kogmaw','妖姬':'leblanc','盲僧':'leesin','女坦':'Leona','露露':'lulu','拉克丝':'Lux',
    '石头人':'Malphite','马尔扎哈':'Malzahar','大树':'Maokai','剑圣':'Yi','女枪':'MissFortune','猴子':'Monkeyking','铁男':'Mordekaiser','莫甘娜':'Morgana'
    ,'娜美':'Nami','狗头':'Nasus','泰坦':'Nautilus','豹女':'Nidalee','梦魇':'Nocturne','雪人':'Nunu','奥拉夫':'Olaf','发条':'Orianna','潘森':'Pantheon','波比':'Poopy','龙龟':'Rammus','鳄鱼':'Renekton','狮子狗':'Rengar',
    '瑞文':'Rivan','兰博':'Rumble','瑞兹':'Ryze','猪女':'Sejuani','小丑':'Shaco','慎':'Shen','龙女':'Shyvana','炼金':'Singed','塞恩':'Sion','希维尔':'Sivir','蝎子':'Skarner','琴女':'Sona','奶妈':'Soraka','乌鸦':'Swain','辛德拉':'Syndra'
    ,'男刀':'Talon','宝石':'Taric','提莫':'Teemo','锤石':'Thresh','小炮':'Tristana','巨魔':'Trundle','蛮王':'Tryndamere','卡牌':'TwistedFate','老鼠':'Twitch','乌迪尔':'Udyr','厄加特':'Urgot','维鲁斯':'Varus','薇恩':'Vayne',
    '小法':'Veigar','蔚':'Vi','维克托':'Viktor','吸血鬼':'Vladimir','狗熊':'Volibear','狼人':'Warwick','泽拉斯':'Xerath','赵信':'XinZhao','掘墓':'Yorick','劫':'Zed','炸弹人':'Ziggs','时光':'Zilean','婕拉':'Zyra','佐伊':'zoe','永恩':'yone','萨米拉':'samira','亚索':'yasuo',
    '塞拉斯':'sylas','卢锡安':'lucian','艾克':'ekko','阿狸':'ahri','瑟提':'sett','奇亚娜':'qiyana','龙王':'aurelionsol','克烈':'kled','妮蔻':'neeko'

  }
position_all = {'top':'top','jun':'jungle','mid':'mid','ad':'bot','sup':'support'}
#由于网站反爬虫机制，使用请求通来伪装成浏览器，否则会被检测为爬虫，爬取数据失败
headers = {'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/87.0.4280.141 Safari/537.36'}
name_input = input('输入名字：')
myname = championname[name_input]
myposition = input('输入位置：')
position = position_all[myposition]
print('正在查询，请稍等~~~')
#向url发出请求，将请求头传入，返回结果保留在res中，res为response对象
res = requests.get('http://www.op.gg/champion/{}/statistics/{}/matchup'.format(myname,position),headers=headers)
#res.text是要解析的网页源代码，html。parser是python的解析器
soup = BeautifulSoup(res.text,'html.parser')

#find方法返回tag对象，find_all返回有tag对象组成的列表，tag是BeautifSoup中的对象
#查找class属性为champion-matchup-champion-list__item的div标签，组成名为items的列表
items = soup.find_all('div',class_='champion-matchup-champion-list__item')

print('英雄 胜率')

for i in items:
 #div中的data-champion-name属性值为英雄名字
 name = i['data-champion-name']
 #div属性中的data-value-winrate属性值为查找的英雄胜率，这里转换为供选择的英雄胜率
 rate = 1-float(i['data-value-winrate'])
 print(name,'{}%'.format(round(rate*100,2)))

由于网址为英文，英雄英文名字个别十分难记难拼，所以我在字典中以中文名或者耳熟能详的外号为key，以url中英雄英文名为value，进行输入转换。
位置使用top，jun，mid，ad，sup方便输入。

到此这篇关于Python爬虫获取op.gg英雄联盟英雄对位胜率的源码的文章就介绍到这了,更多相关Python爬虫英雄联盟内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木！

Python爬虫获取op.gg英雄联盟英雄对位胜率的源码

- Author -

qq_46480884

声明：登载此文出于传递更多信息之目的，并不意味着赞同其观点或证实其描述。

Python 相关文章推荐

精确查找PHP WEBSHELL木马的方法(1)

Apr 12 Python

python监控文件或目录变化

Jun 07 Python

Python数据结构之单链表详解

Sep 12 Python

Django 多语言教程的实现(i18n)

Jul 07 Python

如何使用Python进行OCR识别图片中的文字

Apr 01 Python

Django ORM多对多查询方法(自定义第三张表&ManyToManyField)

Aug 09 Python

Mac 使用python3的matplot画图不显示的解决

Nov 23 Python

python 负数取模运算实例

Jun 03 Python

详解python tkinter包获取本地绝对路径（以获取图片并展示）

Sep 04 Python

Python读取多列数据以及用matplotlib制作图表方法实例

Sep 23 Python

python smtplib发送多个email联系人的实现

Oct 09 Python

python opencv实现直线检测并测出倾斜角度(附源码+注释)

Dec 31 Python

python中spy++的使用超详细教程

Jan 29 #Python

Python Selenium破解滑块验证码最新版(GEETEST95%以上通过率)

Jan 29 #Python

详解pycharm的python包opencv（cv2）无代码提示问题的解决

Jan 29 #Python

如何用python开发Zeroc Ice应用

Jan 29 #Python

详解Pymongo常用查询方法总结

Jan 29 #Python

Python3使用tesserocr识别字母数字验证码的实现

Jan 29 #Python

Python爬取梨视频的示例

Jan 29 #Python

You might like

打造计数器DIY三步曲（中）

2006/10/09 PHP

php连接oracle数据库的方法(测试成功)

2016/05/26 PHP

PHP7 弃用功能

2021/03/09 PHP

JavaScript与函数式编程解释

2007/04/27 Javascript

Textarea根据内容自适应高度

2013/10/28 Javascript

Javascript Ajax异步读取RSS文档具体实现

2013/12/12 Javascript

javascript将浮点数转换成整数的三个方法

2014/06/23 Javascript

jQuery使用after()方法在元素后面添加多项内容的方法

2015/03/26 Javascript

JavaScript 模块化编程(笔记)

2015/04/08 Javascript

JavaScript制作简单的日历效果

2016/03/10 Javascript

javascript实现抽奖程序的简单实例

2016/06/07 Javascript

第一次接触神奇的Bootstrap表单

2016/07/27 Javascript

巧用jQuery选择器提高写表单效率的方法

2016/08/19 Javascript

原生Javascript插件开发实践

2017/01/18 Javascript

vue实现element-ui对话框可拖拽功能

2018/08/17 Javascript

Vue监听页面刷新和关闭功能

2019/06/20 Javascript

JSONObject与JSONArray使用方法解析

2020/09/28 Javascript

针对Vue路由history模式下Nginx后台配置操作

2020/10/22 Javascript

记录一次websocket封装的过程

2020/11/23 Javascript

[00:17]游戏风云独家报道：DD赛后说出数字秘密吓死你们啊！

2014/07/13 DOTA

跟老齐学Python之集合(set)

2014/09/24 Python

python BeautifulSoup设置页面编码的方法

2015/04/03 Python

python利用Guetzli批量压缩图片

2017/03/23 Python

Java实现的执行python脚本工具类示例【使用jython.jar】

2018/03/29 Python

python基于Selenium的web自动化框架

2019/07/14 Python

Django url,从一个页面调到另个页面的方法

2019/08/21 Python

python垃圾回收机制(GC)原理解析

2019/12/30 Python

解决tensorflow打印tensor有省略号的问题

2020/02/04 Python

python pandas.DataFrame.loc函数使用详解

2020/03/26 Python

python为什么会环境变量设置不成功

2020/06/23 Python

英国领先的狗和宠物美容专家：Christies Direct

2017/04/03 全球购物

荷兰美妆护肤品海淘网站：Beautinow（中文）

2020/11/22 全球购物

玩手机检讨书1000字

2014/10/20 职场文书

2015年社区环境卫生工作总结

2015/04/21 职场文书

音乐课外活动总结

2015/05/09 职场文书

mysql查询结果实现多列拼接查询

2022/04/03 MySQL