python语言中pandas字符串分割str.split()函数


Posted in Python onAugust 05, 2022

前言

为了介绍python语言中pandas库在数据分析中的重要作用,本人打算以NBA球星勒布朗詹姆斯在2020-2021赛季常规赛个人数据为例对pandas相关函数进行详细说明。利用爬虫技术,在知名篮球网站虎扑爬取了勒布朗詹姆斯的数据,稍后会将数据上传至csdn,以供大家下载。

这篇文章,详细介绍了pandas字符串分割函数---str.split()的用法。

DataFrame.str.split(pa,n,expand)
pat:字符串分隔符,默认为空格。
n:用于指定需要分割的次数,默认为-1。其中,None,0和-1都被解释为返回所有分割的字符串。
expand:将拆分的字符串展开为单独的列,默认为False。

                True:返回DataFrame / MultiIndex;

                False:返回包含字符串列表的Series / Index。

1、常规赛数据格式

勒布朗詹姆斯2020-2021赛季常规赛个人数据的数据结构如下:

日期 对手 比分 时间 投篮 ...
05/17 鹈鹕 110-98(胜) 27 11-22 ...
05/16 步行者 122-115(胜) 28 11-22 ...
... ... ... ... ... ...

2、计算詹姆斯常规赛命中率

勒布朗詹姆斯2020-2021赛季常规赛个人数据中只有每场比赛的命中率,数据的第4列为每场比赛的投篮数和命中数,格式为"命中数-投篮数"。如果想要计算詹姆斯整个常规赛的命中率,则需要算出他常规赛的投篮数和命中数。此时,需要用到pandas分割字符串函数str.split()。

import numpy as np
import pandas as pd
df = pd.read_csv(“lbj-2020-2021-regular.csv”,encoding="gbk")
df0 = df['投篮'].str.split("-",expand=True)
df0.columns = ['命中数','投篮数']

DataFrame类型的df0即为詹姆斯常规赛的命中数和投篮数,如下所示:

0 命中数 投篮数
1 11 22
2 11 22
... ... ...

因为要分别求取命中数和投篮数的总和,所以需要将df0的列转化为整型,继而可得到詹姆斯整个常规赛的命中率。

df0['命中数'] = df0['命中数'].astype('int')
df0['投篮数'] = df0['投篮数'].astype('int')
ShootRate = df0['命中数'].sum() / df0['投篮数'].sum()

计算得到,詹姆斯2020-2021常规赛投篮命中率为51.34%,还是很不错的水平。

总结

到此这篇关于python语言中pandas字符串分割str.split()函数的文章就介绍到这了,更多相关pandas字符串分割str.split()函数内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
在Python上基于Markov链生成伪随机文本的教程
Apr 17 Python
Python max内置函数详细介绍
Nov 17 Python
解决python 自动安装缺少模块的问题
Oct 22 Python
解决Python运行文件出现out of memory框的问题
Dec 03 Python
python2.7实现复制大量文件及文件夹资料
Aug 31 Python
Windows下PyCharm2018.3.2 安装教程(图文详解)
Oct 24 Python
Python图像处理库PIL中图像格式转换的实现
Feb 26 Python
如何利用Python matplotlib绘制雷达图
Dec 21 Python
详解Python中的文件操作
Jan 14 Python
详解Python+Selenium+ChromeDriver的配置和问题解决
Jan 19 Python
浅谈盘点5种基于Python生成的个性化语音方法
Feb 05 Python
python绘制云雨图raincloud plot
Aug 05 #Python
python计算列表元素与乘积详情
Aug 05 #Python
Pygame游戏开发之太空射击实战敌人精灵篇
Aug 05 #Python
python playwrigh框架入门安装使用
Jul 23 #Python
python playwright之元素定位示例详解
Jul 23 #Python
Sentry的安装、配置、使用教程(Sentry日志手机系统)
Jul 23 #Python
Python中的 No Module named ***问题及解决
Jul 23 #Python
You might like
Apache2中实现多网站域名绑定的实现方法
2011/06/01 PHP
基于PHP创建Cookie数组的详解
2013/07/03 PHP
php基于表单密码验证与HTTP验证用法实例
2015/01/06 PHP
PHP实现搜索地理位置及计算两点地理位置间距离的实例
2016/01/08 PHP
文本框中,回车键触发事件的js代码[多浏览器兼容]
2010/06/07 Javascript
JavaScript中的prototype.bind()方法介绍
2014/04/04 Javascript
分享28款免费实用的 JQuery 图片和内容滑块插件
2014/12/15 Javascript
JavaScript中的值类型转换介绍
2014/12/31 Javascript
推荐一款jQuery插件模板
2015/01/09 Javascript
谈谈我对JavaScript中typeof和instanceof的深入理解
2015/12/25 Javascript
AngularJS基于ui-route实现深层路由的方法【路由嵌套】
2016/12/14 Javascript
浅谈JsonObject中的key-value数据解析排序问题
2017/12/06 Javascript
浅谈如何通过node.js对数据进行MD5加密
2018/05/16 Javascript
9102年webpack4搭建vue项目的方法步骤
2019/02/20 Javascript
iview form清除校验状态的实现
2019/09/19 Javascript
js实现点赞按钮功能的实例代码
2020/03/06 Javascript
[01:52]2020年DOTA2 TI10夏季活动预告片
2020/07/15 DOTA
Python 字典dict使用介绍
2014/11/30 Python
Python验证码识别的方法
2015/07/10 Python
Python 字符串换行的多种方式
2018/09/06 Python
对Django中的权限和分组管理实例讲解
2019/08/16 Python
使用Pycharm在运行过程中,查看每个变量的操作(show variables)
2020/06/08 Python
Python3.7安装PyQt5 运行配置Pycharm的详细教程
2020/10/15 Python
浅析python连接数据库的重要事项
2021/02/22 Python
CSS3常用的几种颜色渐变模式总结
2016/11/18 HTML / CSS
Gweniss格温妮丝女包官网:英国纯手工制造潮流包包品牌
2018/02/07 全球购物
俄罗斯名牌服装网上商店:UNIQUE FABRIC
2019/07/25 全球购物
门卫岗位安全职责
2013/12/13 职场文书
客户经理竞聘演讲稿
2014/05/15 职场文书
工程项目经理任命书
2014/06/05 职场文书
七年级地理教学计划
2015/01/22 职场文书
初中英语教师个人工作总结
2015/02/09 职场文书
董事长助理工作总结2015
2015/07/23 职场文书
2016三严三实专题教育活动心得体会
2016/01/06 职场文书
Python开发之QT解决无边框界面拖动卡屏问题(附带源码)
2021/05/27 Python
Sentry的安装、配置、使用教程(Sentry日志手机系统)
2022/07/23 Python