python语言中pandas字符串分割str.split()函数


Posted in Python onAugust 05, 2022

前言

为了介绍python语言中pandas库在数据分析中的重要作用,本人打算以NBA球星勒布朗詹姆斯在2020-2021赛季常规赛个人数据为例对pandas相关函数进行详细说明。利用爬虫技术,在知名篮球网站虎扑爬取了勒布朗詹姆斯的数据,稍后会将数据上传至csdn,以供大家下载。

这篇文章,详细介绍了pandas字符串分割函数---str.split()的用法。

DataFrame.str.split(pa,n,expand)
pat:字符串分隔符,默认为空格。
n:用于指定需要分割的次数,默认为-1。其中,None,0和-1都被解释为返回所有分割的字符串。
expand:将拆分的字符串展开为单独的列,默认为False。

                True:返回DataFrame / MultiIndex;

                False:返回包含字符串列表的Series / Index。

1、常规赛数据格式

勒布朗詹姆斯2020-2021赛季常规赛个人数据的数据结构如下:

日期 对手 比分 时间 投篮 ...
05/17 鹈鹕 110-98(胜) 27 11-22 ...
05/16 步行者 122-115(胜) 28 11-22 ...
... ... ... ... ... ...

2、计算詹姆斯常规赛命中率

勒布朗詹姆斯2020-2021赛季常规赛个人数据中只有每场比赛的命中率,数据的第4列为每场比赛的投篮数和命中数,格式为"命中数-投篮数"。如果想要计算詹姆斯整个常规赛的命中率,则需要算出他常规赛的投篮数和命中数。此时,需要用到pandas分割字符串函数str.split()。

import numpy as np
import pandas as pd
df = pd.read_csv(“lbj-2020-2021-regular.csv”,encoding="gbk")
df0 = df['投篮'].str.split("-",expand=True)
df0.columns = ['命中数','投篮数']

DataFrame类型的df0即为詹姆斯常规赛的命中数和投篮数,如下所示:

0 命中数 投篮数
1 11 22
2 11 22
... ... ...

因为要分别求取命中数和投篮数的总和,所以需要将df0的列转化为整型,继而可得到詹姆斯整个常规赛的命中率。

df0['命中数'] = df0['命中数'].astype('int')
df0['投篮数'] = df0['投篮数'].astype('int')
ShootRate = df0['命中数'].sum() / df0['投篮数'].sum()

计算得到,詹姆斯2020-2021常规赛投篮命中率为51.34%,还是很不错的水平。

总结

到此这篇关于python语言中pandas字符串分割str.split()函数的文章就介绍到这了,更多相关pandas字符串分割str.split()函数内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
python调用Moxa PCOMM Lite通过串口Ymodem协议实现发送文件
Aug 15 Python
Python的面向对象思想分析
Jan 14 Python
Python写的一个简单监控系统
Jun 19 Python
详解Python迭代和迭代器
Mar 28 Python
Python实现的破解字符串找茬游戏算法示例
Sep 25 Python
PyQt5每天必学之QSplitter实现窗口分隔
Apr 19 Python
浅谈Django中的数据库模型类-models.py(一对一的关系)
May 30 Python
Python 对输入的数字进行排序的方法
Jun 23 Python
解决在keras中使用model.save()函数保存模型失败的问题
May 21 Python
python中if嵌套命令实例讲解
Feb 25 Python
发工资啦!教你用Python实现邮箱自动群发工资条
May 10 Python
对象析构函数__del__在Python中何时使用
Mar 22 Python
python绘制云雨图raincloud plot
Aug 05 #Python
python计算列表元素与乘积详情
Aug 05 #Python
Pygame游戏开发之太空射击实战敌人精灵篇
Aug 05 #Python
python playwrigh框架入门安装使用
Jul 23 #Python
python playwright之元素定位示例详解
Jul 23 #Python
Sentry的安装、配置、使用教程(Sentry日志手机系统)
Jul 23 #Python
Python中的 No Module named ***问题及解决
Jul 23 #Python
You might like
基于Laravel实现的用户动态模块开发
2017/09/21 PHP
幻宇的层模拟窗口效果-提供演示和下载
2007/01/20 Javascript
IE DOM实现存在的部分问题及解决方法
2009/07/25 Javascript
JavaScript 学习历程和心得分享
2010/12/12 Javascript
JS定时关闭窗口的实例
2013/05/22 Javascript
如何在指定的地方插入html内容和文本内容
2013/12/23 Javascript
fmt:formatDate的输出格式详解
2014/01/09 Javascript
javascript单页面手势滑屏切换原理详解
2016/03/21 Javascript
JavaScript中的操作符类型转换示例总结
2016/05/30 Javascript
利用JavaScript阻止表单提交的两种方法
2016/08/11 Javascript
AngularJS Phonecat实例讲解
2016/11/21 Javascript
详解react-webpack2-热模块替换[HMR]
2017/08/03 Javascript
利用angular、react和vue实现相同的面试题组件
2018/02/19 Javascript
Vue父子组建的简单通信之控制开关Switch的实现
2018/06/04 Javascript
Layer弹出层动态获取数据的方法
2018/08/20 Javascript
解决eclipse中没有js代码提示的问题
2018/10/10 Javascript
前端Electron新手入门教程详解
2019/06/21 Javascript
vuex管理状态 刷新页面保持不被清空的解决方案
2019/11/11 Javascript
vue 组件基础知识总结
2021/01/26 Vue.js
[55:35]VGJ.S vs Mski Supermajor小组赛C组 BO3 第二场 6.3
2018/06/04 DOTA
python实现探测socket和web服务示例
2014/03/28 Python
python自动化测试之setUp与tearDown实例
2014/09/28 Python
Python命令行参数解析模块getopt使用实例
2015/04/13 Python
python读写二进制文件的方法
2015/05/09 Python
使用Python来编写HTTP服务器的超级指南
2016/02/18 Python
详解python里使用正则表达式的全匹配功能
2017/10/19 Python
Python和Java进行DES加密和解密的实例
2018/01/09 Python
对Python 内建函数和保留字详解
2018/10/15 Python
Python 中导入csv数据的三种方法
2018/11/01 Python
python如何进行矩阵运算
2020/06/05 Python
Python 内存管理机制全面分析
2021/01/16 Python
Python3使用Selenium获取session和token方法详解
2021/02/16 Python
美国网上眼镜供应商:LEOTONY(眼镜、RX太阳镜和太阳镜)
2017/10/31 全球购物
安娜卡列尼娜观后感
2015/06/11 职场文书
某某幼儿园的教育教学管理调研分析报告
2019/11/29 职场文书
《最终幻想14》6.01版本4月5日推出 追加新任务新道具
2022/04/03 其他游戏