python语言中pandas字符串分割str.split()函数


Posted in Python onAugust 05, 2022

前言

为了介绍python语言中pandas库在数据分析中的重要作用,本人打算以NBA球星勒布朗詹姆斯在2020-2021赛季常规赛个人数据为例对pandas相关函数进行详细说明。利用爬虫技术,在知名篮球网站虎扑爬取了勒布朗詹姆斯的数据,稍后会将数据上传至csdn,以供大家下载。

这篇文章,详细介绍了pandas字符串分割函数---str.split()的用法。

DataFrame.str.split(pa,n,expand)
pat:字符串分隔符,默认为空格。
n:用于指定需要分割的次数,默认为-1。其中,None,0和-1都被解释为返回所有分割的字符串。
expand:将拆分的字符串展开为单独的列,默认为False。

                True:返回DataFrame / MultiIndex;

                False:返回包含字符串列表的Series / Index。

1、常规赛数据格式

勒布朗詹姆斯2020-2021赛季常规赛个人数据的数据结构如下:

日期 对手 比分 时间 投篮 ...
05/17 鹈鹕 110-98(胜) 27 11-22 ...
05/16 步行者 122-115(胜) 28 11-22 ...
... ... ... ... ... ...

2、计算詹姆斯常规赛命中率

勒布朗詹姆斯2020-2021赛季常规赛个人数据中只有每场比赛的命中率,数据的第4列为每场比赛的投篮数和命中数,格式为"命中数-投篮数"。如果想要计算詹姆斯整个常规赛的命中率,则需要算出他常规赛的投篮数和命中数。此时,需要用到pandas分割字符串函数str.split()。

import numpy as np
import pandas as pd
df = pd.read_csv(“lbj-2020-2021-regular.csv”,encoding="gbk")
df0 = df['投篮'].str.split("-",expand=True)
df0.columns = ['命中数','投篮数']

DataFrame类型的df0即为詹姆斯常规赛的命中数和投篮数,如下所示:

0 命中数 投篮数
1 11 22
2 11 22
... ... ...

因为要分别求取命中数和投篮数的总和,所以需要将df0的列转化为整型,继而可得到詹姆斯整个常规赛的命中率。

df0['命中数'] = df0['命中数'].astype('int')
df0['投篮数'] = df0['投篮数'].astype('int')
ShootRate = df0['命中数'].sum() / df0['投篮数'].sum()

计算得到,詹姆斯2020-2021常规赛投篮命中率为51.34%,还是很不错的水平。

总结

到此这篇关于python语言中pandas字符串分割str.split()函数的文章就介绍到这了,更多相关pandas字符串分割str.split()函数内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
python支持断点续传的多线程下载示例
Jan 16 Python
一条命令解决mac版本python IDLE不能输入中文问题
May 15 Python
flask中过滤器的使用详解
Aug 01 Python
python 获取utc时间转化为本地时间的方法
Dec 31 Python
django框架面向对象ORM模型继承用法实例分析
Jul 29 Python
python修改FTP服务器上的文件名
Sep 11 Python
Python 给下载文件显示进度条和下载时间的实现
Apr 02 Python
解决numpy矩阵相减出现的负值自动转正值的问题
Jun 03 Python
Python新手学习raise用法
Jun 03 Python
OpenCV 使用imread()函数读取图片的六种正确姿势
Jul 09 Python
python安装sklearn模块的方法详解
Nov 28 Python
python os.listdir()乱码解决方案
Jan 31 Python
python绘制云雨图raincloud plot
Aug 05 #Python
python计算列表元素与乘积详情
Aug 05 #Python
Pygame游戏开发之太空射击实战敌人精灵篇
Aug 05 #Python
python playwrigh框架入门安装使用
Jul 23 #Python
python playwright之元素定位示例详解
Jul 23 #Python
Sentry的安装、配置、使用教程(Sentry日志手机系统)
Jul 23 #Python
Python中的 No Module named ***问题及解决
Jul 23 #Python
You might like
mysql_fetch_row,mysql_fetch_array,mysql_fetch_assoc的区别
2009/04/24 PHP
PHP中ini_set和ini_get函数的用法小结
2014/02/18 PHP
php把session写入数据库示例
2014/02/26 PHP
laravel-admin表单提交隐藏一些数据,回调时获取数据的方法
2019/10/08 PHP
关于IFRAME 自适应高度的研究
2006/07/20 Javascript
JQuery 构建客户/服务分离的链接模型中Table分页代码效率初探
2010/01/22 Javascript
JQuery中绑定事件(bind())和移除事件(unbind())
2015/02/27 Javascript
JS+CSS实现另类带提示效果的竖向导航菜单
2015/10/15 Javascript
D3.js实现散点图和气泡图的方法详解
2016/09/21 Javascript
JavaScript中undefined和null的区别
2017/05/03 Javascript
JavaScript Drum Kit 指南(纯 JS 模拟敲鼓效果)
2017/07/23 Javascript
Vue实现typeahead组件功能(非常靠谱)
2017/08/26 Javascript
ajax+node+request爬取网络图片的实例(宅男福利)
2017/08/28 Javascript
浅谈webpack对样式的处理
2018/01/05 Javascript
react router4+redux实现路由权限控制的方法
2018/05/03 Javascript
vue addRoutes实现动态权限路由菜单的示例
2018/05/15 Javascript
vue项目部署上线遇到的问题及解决方法
2018/06/10 Javascript
vue-cli点击实现全屏功能
2020/03/07 Javascript
Python2.x版本中基本的中文编码问题解决
2015/10/12 Python
Python AES加密模块用法分析
2017/05/22 Python
python实现抖音视频批量下载
2018/06/20 Python
python解析json串与正则匹配对比方法
2018/12/20 Python
python将控制台输出保存至文件的方法
2019/01/07 Python
浅谈Python3中strip()、lstrip()、rstrip()用法详解
2019/04/29 Python
python pandas生成时间列表
2019/06/29 Python
tf.concat中axis的含义与使用详解
2020/02/07 Python
CSS3 mask 遮罩的具体使用方法
2017/11/03 HTML / CSS
解决H5的a标签的download属性下载service上的文件出现跨域问题
2019/07/16 HTML / CSS
HTML5+CSS3:3D展示商品信息示例
2017/01/03 HTML / CSS
windeln官方海外旗舰店:德淘超人气母婴超市
2017/12/15 全球购物
新闻学专业应届生求职信
2013/11/08 职场文书
优秀求职自荐信怎样写
2013/12/18 职场文书
18岁生日感言
2014/01/12 职场文书
大学生个人实习的自我评价
2014/02/15 职场文书
英文求职信写作小建议
2014/02/16 职场文书
同意落户证明
2015/06/19 职场文书