python语言中pandas字符串分割str.split()函数


Posted in Python onAugust 05, 2022

前言

为了介绍python语言中pandas库在数据分析中的重要作用,本人打算以NBA球星勒布朗詹姆斯在2020-2021赛季常规赛个人数据为例对pandas相关函数进行详细说明。利用爬虫技术,在知名篮球网站虎扑爬取了勒布朗詹姆斯的数据,稍后会将数据上传至csdn,以供大家下载。

这篇文章,详细介绍了pandas字符串分割函数---str.split()的用法。

DataFrame.str.split(pa,n,expand)
pat:字符串分隔符,默认为空格。
n:用于指定需要分割的次数,默认为-1。其中,None,0和-1都被解释为返回所有分割的字符串。
expand:将拆分的字符串展开为单独的列,默认为False。

                True:返回DataFrame / MultiIndex;

                False:返回包含字符串列表的Series / Index。

1、常规赛数据格式

勒布朗詹姆斯2020-2021赛季常规赛个人数据的数据结构如下:

日期 对手 比分 时间 投篮 ...
05/17 鹈鹕 110-98(胜) 27 11-22 ...
05/16 步行者 122-115(胜) 28 11-22 ...
... ... ... ... ... ...

2、计算詹姆斯常规赛命中率

勒布朗詹姆斯2020-2021赛季常规赛个人数据中只有每场比赛的命中率,数据的第4列为每场比赛的投篮数和命中数,格式为"命中数-投篮数"。如果想要计算詹姆斯整个常规赛的命中率,则需要算出他常规赛的投篮数和命中数。此时,需要用到pandas分割字符串函数str.split()。

import numpy as np
import pandas as pd
df = pd.read_csv(“lbj-2020-2021-regular.csv”,encoding="gbk")
df0 = df['投篮'].str.split("-",expand=True)
df0.columns = ['命中数','投篮数']

DataFrame类型的df0即为詹姆斯常规赛的命中数和投篮数,如下所示:

0 命中数 投篮数
1 11 22
2 11 22
... ... ...

因为要分别求取命中数和投篮数的总和,所以需要将df0的列转化为整型,继而可得到詹姆斯整个常规赛的命中率。

df0['命中数'] = df0['命中数'].astype('int')
df0['投篮数'] = df0['投篮数'].astype('int')
ShootRate = df0['命中数'].sum() / df0['投篮数'].sum()

计算得到,詹姆斯2020-2021常规赛投篮命中率为51.34%,还是很不错的水平。

总结

到此这篇关于python语言中pandas字符串分割str.split()函数的文章就介绍到这了,更多相关pandas字符串分割str.split()函数内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
Python按行读取文件的简单实现方法
Jun 22 Python
fastcgi文件读取漏洞之python扫描脚本
Apr 23 Python
python正则表达式re之compile函数解析
Oct 25 Python
python读取与写入csv格式文件的示例代码
Dec 16 Python
ubuntu环境下python虚拟环境的安装过程
Jan 07 Python
tensorflow 打印内存中的变量方法
Jul 30 Python
通过cmd进入python的实例操作
Jun 26 Python
Python中使用threading.Event协调线程的运行详解
May 02 Python
python中常见错误及解决方法
Jun 21 Python
Python 数据的累加与统计的示例代码
Aug 03 Python
python 实现简易的记事本
Nov 30 Python
Python一行代码实现自动发邮件功能
May 30 Python
python绘制云雨图raincloud plot
Aug 05 #Python
python计算列表元素与乘积详情
Aug 05 #Python
Pygame游戏开发之太空射击实战敌人精灵篇
Aug 05 #Python
python playwrigh框架入门安装使用
Jul 23 #Python
python playwright之元素定位示例详解
Jul 23 #Python
Sentry的安装、配置、使用教程(Sentry日志手机系统)
Jul 23 #Python
Python中的 No Module named ***问题及解决
Jul 23 #Python
You might like
第八节--访问方式
2006/11/16 PHP
php初学者写及时补给skype用户充话费的小程序
2008/11/02 PHP
PHPExcel笔记, mpdf导出
2016/05/03 PHP
php使用ftp实现文件上传与下载功能
2017/07/21 PHP
jQuery 选择器、DOM操作、事件、动画
2010/11/25 Javascript
Extjs中TabPane如何嵌套在其他网页中实现思路及代码
2013/01/27 Javascript
调用innerHTML之后onclick失效问题的解决方法
2014/01/28 Javascript
JS自调用匿名函数具体实现
2014/02/11 Javascript
jquery处理页面弹出层查询数据等待操作实例
2015/03/25 Javascript
JavaScript前端开发之实现二进制读写操作
2015/11/04 Javascript
跟我学习javascript的函数和函数表达式
2015/11/16 Javascript
javascript拖拽应用实例(二)
2016/03/25 Javascript
JS模拟实现ECMAScript5新增的数组方法
2017/03/20 Javascript
JavaScript箭头(arrow)函数详解
2017/06/04 Javascript
vue-cli + sass 的正确打开方式图文详解
2017/10/27 Javascript
利用nodeJs anywhere搭建本地服务器环境的方法
2018/05/12 NodeJs
nodejs用gulp管理前端文件方法
2018/06/24 NodeJs
javascript实现自由编辑图片代码详解
2019/06/21 Javascript
基于jsbarcode 生成条形码并将生成的条码保存至本地+源码
2020/04/27 Javascript
python MNIST手写识别数据调用API的方法
2018/08/08 Python
python使用matplotlib库生成随机漫步图
2018/08/27 Python
浅谈python多进程共享变量Value的使用tips
2019/07/16 Python
Python使用百度翻译开发平台实现英文翻译为中文功能示例
2019/08/08 Python
Pytorch to(device)用法
2020/01/08 Python
windows下python 3.9 Numpy scipy和matlabplot的安装教程详解
2020/11/28 Python
基于HTML5代码实现折叠菜单附源码下载
2015/11/27 HTML / CSS
Sixt美国租车:高端豪华车型自驾体验
2017/09/02 全球购物
Under Armour澳大利亚官网:美国知名的高端功能性运动品牌
2018/02/22 全球购物
大学生职业生涯规划书模板
2014/01/18 职场文书
党员一句话承诺大全
2014/03/28 职场文书
优秀应届毕业生自荐书
2014/06/29 职场文书
2015元旦标语横幅
2014/12/09 职场文书
国庆庆典邀请函
2015/02/02 职场文书
学生逃课万能检讨书2000字
2015/02/17 职场文书
新员工试用期自我评价
2015/03/10 职场文书
Java服务调用RestTemplate与HttpClient的使用详解
2022/06/21 Java/Android