python语言中pandas字符串分割str.split()函数


Posted in Python onAugust 05, 2022

前言

为了介绍python语言中pandas库在数据分析中的重要作用,本人打算以NBA球星勒布朗詹姆斯在2020-2021赛季常规赛个人数据为例对pandas相关函数进行详细说明。利用爬虫技术,在知名篮球网站虎扑爬取了勒布朗詹姆斯的数据,稍后会将数据上传至csdn,以供大家下载。

这篇文章,详细介绍了pandas字符串分割函数---str.split()的用法。

DataFrame.str.split(pa,n,expand)
pat:字符串分隔符,默认为空格。
n:用于指定需要分割的次数,默认为-1。其中,None,0和-1都被解释为返回所有分割的字符串。
expand:将拆分的字符串展开为单独的列,默认为False。

                True:返回DataFrame / MultiIndex;

                False:返回包含字符串列表的Series / Index。

1、常规赛数据格式

勒布朗詹姆斯2020-2021赛季常规赛个人数据的数据结构如下:

日期 对手 比分 时间 投篮 ...
05/17 鹈鹕 110-98(胜) 27 11-22 ...
05/16 步行者 122-115(胜) 28 11-22 ...
... ... ... ... ... ...

2、计算詹姆斯常规赛命中率

勒布朗詹姆斯2020-2021赛季常规赛个人数据中只有每场比赛的命中率,数据的第4列为每场比赛的投篮数和命中数,格式为"命中数-投篮数"。如果想要计算詹姆斯整个常规赛的命中率,则需要算出他常规赛的投篮数和命中数。此时,需要用到pandas分割字符串函数str.split()。

import numpy as np
import pandas as pd
df = pd.read_csv(“lbj-2020-2021-regular.csv”,encoding="gbk")
df0 = df['投篮'].str.split("-",expand=True)
df0.columns = ['命中数','投篮数']

DataFrame类型的df0即为詹姆斯常规赛的命中数和投篮数,如下所示:

0 命中数 投篮数
1 11 22
2 11 22
... ... ...

因为要分别求取命中数和投篮数的总和,所以需要将df0的列转化为整型,继而可得到詹姆斯整个常规赛的命中率。

df0['命中数'] = df0['命中数'].astype('int')
df0['投篮数'] = df0['投篮数'].astype('int')
ShootRate = df0['命中数'].sum() / df0['投篮数'].sum()

计算得到,詹姆斯2020-2021常规赛投篮命中率为51.34%,还是很不错的水平。

总结

到此这篇关于python语言中pandas字符串分割str.split()函数的文章就介绍到这了,更多相关pandas字符串分割str.split()函数内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
python异常和文件处理机制详解
Jul 19 Python
python中print的不换行即时输出的快速解决方法
Jul 20 Python
Python基础教程之if判断,while循环,循环嵌套
Apr 25 Python
python 自定义装饰器实例详解
Jul 20 Python
Python3中urlencode和urldecode的用法详解
Jul 23 Python
Python assert语句的简单使用示例
Jul 28 Python
Python3爬虫中关于中文分词的详解
Jul 29 Python
scrapy中如何设置应用cookies的方法(3种)
Sep 22 Python
python爬虫中url管理器去重操作实例
Nov 30 Python
python 通过 pybind11 使用Eigen加速代码的步骤
Dec 07 Python
看看如何用Python绘制小米新版天价logo
Apr 20 Python
Python3中PyQt5简单实现文件打开及保存
Jun 10 Python
python绘制云雨图raincloud plot
Aug 05 #Python
python计算列表元素与乘积详情
Aug 05 #Python
Pygame游戏开发之太空射击实战敌人精灵篇
Aug 05 #Python
python playwrigh框架入门安装使用
Jul 23 #Python
python playwright之元素定位示例详解
Jul 23 #Python
Sentry的安装、配置、使用教程(Sentry日志手机系统)
Jul 23 #Python
Python中的 No Module named ***问题及解决
Jul 23 #Python
You might like
php中http与https跨域共享session的解决方法
2014/12/20 PHP
php opendir()列出目录下所有文件的实例代码
2016/10/02 PHP
smarty模板的使用方法实例分析
2019/09/18 PHP
解决laravel5中auth用户登录其他页面获取不到登录信息的问题
2019/10/08 PHP
thinkphp框架无限级栏目的排序功能实现方法示例
2020/03/29 PHP
jquery中的sortable排序之后的保存状态的解决方法
2010/01/28 Javascript
form.submit()不能提交表单的原因分析
2014/10/23 Javascript
Nodejs极简入门教程(一):模块机制
2014/10/25 NodeJs
使用jQuery仿苹果官网焦点图特效
2014/12/23 Javascript
本地Bootstrap文件字体图标引入却无法显示问题的解决方法
2020/04/18 Javascript
HTML5canvas 绘制一个圆环形的进度表示实例
2016/12/16 Javascript
ES6新特性之类(Class)和继承(Extends)相关概念与用法分析
2017/05/24 Javascript
浅谈vue的几种绑定变量的值 防止其改变的方法
2018/03/01 Javascript
vue计算属性和监听器实例解析
2018/05/10 Javascript
详解解决Vue相同路由参数不同不会刷新的问题
2018/10/12 Javascript
通过vue手动封装on、emit、off的代码详解
2019/05/29 Javascript
js实现for循环跳过undefined值示例
2019/07/02 Javascript
Echarts实现多条折线可拖拽效果
2019/12/19 Javascript
python中常用的各种数据库操作模块和连接实例
2014/05/29 Python
python 3.6 tkinter+urllib+json实现火车车次信息查询功能
2017/12/20 Python
详解Python装饰器
2019/03/25 Python
python实现网站微信登录的示例代码
2019/09/18 Python
详解python itertools功能
2020/02/07 Python
python3.7+selenium模拟淘宝登录功能的实现
2020/05/26 Python
解决pytorch 数据类型报错的问题
2021/03/03 Python
Darphin迪梵官网: 来自巴黎,植物和精油调制的护肤品牌
2016/10/11 全球购物
来自世界各地的优质葡萄酒:VineShop24
2018/07/09 全球购物
12岁生日感言
2014/01/21 职场文书
简易版租房协议书范本
2014/10/13 职场文书
2014幼儿园家长工作总结
2014/11/10 职场文书
2015年教师节新闻稿
2015/07/17 职场文书
2019职场单身人才调研报告:互联网行业单身比例最高
2019/08/07 职场文书
python实现图片批量压缩
2021/04/24 Python
详解CSS伪元素的妙用单标签之美
2021/05/25 HTML / CSS
Python Pandas模块实现数据的统计分析的方法
2021/06/24 Python
详解Go语言中配置文件使用与日志配置
2022/06/01 Golang