python语言中pandas字符串分割str.split()函数


Posted in Python onAugust 05, 2022

前言

为了介绍python语言中pandas库在数据分析中的重要作用,本人打算以NBA球星勒布朗詹姆斯在2020-2021赛季常规赛个人数据为例对pandas相关函数进行详细说明。利用爬虫技术,在知名篮球网站虎扑爬取了勒布朗詹姆斯的数据,稍后会将数据上传至csdn,以供大家下载。

这篇文章,详细介绍了pandas字符串分割函数---str.split()的用法。

DataFrame.str.split(pa,n,expand)
pat:字符串分隔符,默认为空格。
n:用于指定需要分割的次数,默认为-1。其中,None,0和-1都被解释为返回所有分割的字符串。
expand:将拆分的字符串展开为单独的列,默认为False。

                True:返回DataFrame / MultiIndex;

                False:返回包含字符串列表的Series / Index。

1、常规赛数据格式

勒布朗詹姆斯2020-2021赛季常规赛个人数据的数据结构如下:

日期 对手 比分 时间 投篮 ...
05/17 鹈鹕 110-98(胜) 27 11-22 ...
05/16 步行者 122-115(胜) 28 11-22 ...
... ... ... ... ... ...

2、计算詹姆斯常规赛命中率

勒布朗詹姆斯2020-2021赛季常规赛个人数据中只有每场比赛的命中率,数据的第4列为每场比赛的投篮数和命中数,格式为"命中数-投篮数"。如果想要计算詹姆斯整个常规赛的命中率,则需要算出他常规赛的投篮数和命中数。此时,需要用到pandas分割字符串函数str.split()。

import numpy as np
import pandas as pd
df = pd.read_csv(“lbj-2020-2021-regular.csv”,encoding="gbk")
df0 = df['投篮'].str.split("-",expand=True)
df0.columns = ['命中数','投篮数']

DataFrame类型的df0即为詹姆斯常规赛的命中数和投篮数,如下所示:

0 命中数 投篮数
1 11 22
2 11 22
... ... ...

因为要分别求取命中数和投篮数的总和,所以需要将df0的列转化为整型,继而可得到詹姆斯整个常规赛的命中率。

df0['命中数'] = df0['命中数'].astype('int')
df0['投篮数'] = df0['投篮数'].astype('int')
ShootRate = df0['命中数'].sum() / df0['投篮数'].sum()

计算得到,詹姆斯2020-2021常规赛投篮命中率为51.34%,还是很不错的水平。

总结

到此这篇关于python语言中pandas字符串分割str.split()函数的文章就介绍到这了,更多相关pandas字符串分割str.split()函数内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
Python 过滤字符串的技巧,map与itertools.imap
Sep 06 Python
python 域名分析工具实现代码
Jul 15 Python
python socket网络编程步骤详解(socket套接字使用)
Dec 06 Python
用PyQt进行Python图形界面的程序的开发的入门指引
Apr 14 Python
Python跨文件全局变量的实现方法示例
Dec 10 Python
numpy 计算两个数组重复程度的方法
Nov 07 Python
Python 类属性与实例属性,类对象与实例对象用法分析
Sep 20 Python
python OpenCV GrabCut使用实例解析
Nov 11 Python
Python线程threading模块用法详解
Feb 26 Python
Python自定义sorted排序实现方法详解
Sep 18 Python
如何正确理解python装饰器
Jun 15 Python
Python中Selenium对Cookie的操作方法
Jul 09 Python
python绘制云雨图raincloud plot
Aug 05 #Python
python计算列表元素与乘积详情
Aug 05 #Python
Pygame游戏开发之太空射击实战敌人精灵篇
Aug 05 #Python
python playwrigh框架入门安装使用
Jul 23 #Python
python playwright之元素定位示例详解
Jul 23 #Python
Sentry的安装、配置、使用教程(Sentry日志手机系统)
Jul 23 #Python
Python中的 No Module named ***问题及解决
Jul 23 #Python
You might like
探讨PHP使用eAccelerator的API开发详解
2013/06/09 PHP
php自定义的格式化时间示例代码
2013/12/05 PHP
php组合排序简单实现方法
2016/10/15 PHP
PHP制作登录异常ip检测功能的实例代码
2016/11/16 PHP
再谈javascript图片预加载技术(详细演示)
2011/03/12 Javascript
JavaScript高级程序设计 XML、Ajax 学习笔记
2011/09/10 Javascript
js jquery ajax的几种用法总结(及优缺点介绍)
2014/01/28 Javascript
Javascript学习笔记之函数篇(四):arguments 对象
2014/11/23 Javascript
jQuery点缩略图弹出层显示大图片
2015/02/13 Javascript
jquery结婚电子请柬特效源码分享
2015/08/21 Javascript
js实现文字超出部分用省略号代替实例代码
2016/09/01 Javascript
详解Html a标签中href和onclick用法、区别、优先级别
2017/01/16 Javascript
如何重置vue打印变量的显示方式
2017/12/06 Javascript
node实现分片下载的示例代码
2018/10/17 Javascript
vue-router实现编程式导航的代码实例
2019/01/19 Javascript
postman自定义函数实现 时间函数的思路详解
2019/04/17 Javascript
VueJs里利用CryptoJs实现加密及解密的方法示例
2019/04/29 Javascript
JavaScript适配器模式原理与用法实例详解
2020/03/09 Javascript
JS Web Flex弹性盒子模型代码实例
2020/03/10 Javascript
Node.js API详解之 assert模块用法实例分析
2020/05/26 Javascript
vue+swiper实现左右滑动的测试题功能
2020/10/30 Javascript
Python通过解析网页实现看报程序的方法
2014/08/04 Python
Python输出PowerPoint(ppt)文件中全部文字信息的方法
2015/04/28 Python
python中单下划线_的常见用法总结
2018/07/10 Python
python银行系统实现源码
2019/10/25 Python
python3连接mysql获取ansible动态inventory脚本
2020/01/19 Python
详解Canvas 跨域脱坑实践
2018/11/07 HTML / CSS
DTD的含义以及作用
2014/01/26 面试题
成功的酒店创业计划书
2013/12/27 职场文书
运动会解说词100字
2014/01/31 职场文书
《九色鹿》教学反思
2014/02/27 职场文书
亲子阅读的活动方案
2014/08/15 职场文书
前台文员岗位职责
2015/02/04 职场文书
奖学金主要事迹范文
2015/11/04 职场文书
Redis5之后版本的高可用集群搭建的实现
2021/04/27 Redis
关于python pygame游戏进行声音添加的技巧
2021/10/24 Python