python语言中pandas字符串分割str.split()函数


Posted in Python onAugust 05, 2022

前言

为了介绍python语言中pandas库在数据分析中的重要作用,本人打算以NBA球星勒布朗詹姆斯在2020-2021赛季常规赛个人数据为例对pandas相关函数进行详细说明。利用爬虫技术,在知名篮球网站虎扑爬取了勒布朗詹姆斯的数据,稍后会将数据上传至csdn,以供大家下载。

这篇文章,详细介绍了pandas字符串分割函数---str.split()的用法。

DataFrame.str.split(pa,n,expand)
pat:字符串分隔符,默认为空格。
n:用于指定需要分割的次数,默认为-1。其中,None,0和-1都被解释为返回所有分割的字符串。
expand:将拆分的字符串展开为单独的列,默认为False。

                True:返回DataFrame / MultiIndex;

                False:返回包含字符串列表的Series / Index。

1、常规赛数据格式

勒布朗詹姆斯2020-2021赛季常规赛个人数据的数据结构如下:

日期 对手 比分 时间 投篮 ...
05/17 鹈鹕 110-98(胜) 27 11-22 ...
05/16 步行者 122-115(胜) 28 11-22 ...
... ... ... ... ... ...

2、计算詹姆斯常规赛命中率

勒布朗詹姆斯2020-2021赛季常规赛个人数据中只有每场比赛的命中率,数据的第4列为每场比赛的投篮数和命中数,格式为"命中数-投篮数"。如果想要计算詹姆斯整个常规赛的命中率,则需要算出他常规赛的投篮数和命中数。此时,需要用到pandas分割字符串函数str.split()。

import numpy as np
import pandas as pd
df = pd.read_csv(“lbj-2020-2021-regular.csv”,encoding="gbk")
df0 = df['投篮'].str.split("-",expand=True)
df0.columns = ['命中数','投篮数']

DataFrame类型的df0即为詹姆斯常规赛的命中数和投篮数,如下所示:

0 命中数 投篮数
1 11 22
2 11 22
... ... ...

因为要分别求取命中数和投篮数的总和,所以需要将df0的列转化为整型,继而可得到詹姆斯整个常规赛的命中率。

df0['命中数'] = df0['命中数'].astype('int')
df0['投篮数'] = df0['投篮数'].astype('int')
ShootRate = df0['命中数'].sum() / df0['投篮数'].sum()

计算得到,詹姆斯2020-2021常规赛投篮命中率为51.34%,还是很不错的水平。

总结

到此这篇关于python语言中pandas字符串分割str.split()函数的文章就介绍到这了,更多相关pandas字符串分割str.split()函数内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
python删除列表中重复记录的方法
Apr 28 Python
python实现从字典中删除元素的方法
May 04 Python
python开发之tkinter实现图形随鼠标移动的方法
Nov 11 Python
详解python发送各类邮件的主要方法
Dec 22 Python
Python不使用int()函数把字符串转换为数字的方法
Jul 09 Python
详解python里的命名规范
Jul 16 Python
python中的插值 scipy-interp的实现代码
Jul 23 Python
python绘制多个曲线的折线图
Mar 23 Python
python__name__原理及用法详解
Nov 02 Python
Python 求数组局部最大值的实例
Nov 26 Python
Python 爬虫批量爬取网页图片保存到本地的实现代码
Dec 24 Python
Django 实现jwt认证的示例
Apr 30 Python
python绘制云雨图raincloud plot
Aug 05 #Python
python计算列表元素与乘积详情
Aug 05 #Python
Pygame游戏开发之太空射击实战敌人精灵篇
Aug 05 #Python
python playwrigh框架入门安装使用
Jul 23 #Python
python playwright之元素定位示例详解
Jul 23 #Python
Sentry的安装、配置、使用教程(Sentry日志手机系统)
Jul 23 #Python
Python中的 No Module named ***问题及解决
Jul 23 #Python
You might like
IIS php环境配置PHP5 MySQL5 ZendOptimizer phpmyadmin安装与配置
2008/11/18 PHP
跟我学Laravel之请求与输入
2014/10/15 PHP
WIN8.1下搭建PHP5.6环境
2015/04/29 PHP
PHP弹出对话框技巧详细解读
2015/09/26 PHP
php 静态属性和静态方法区别详解
2017/04/09 PHP
Yii框架where查询用法实例分析
2019/10/22 PHP
TFDN图片播放器 不错自动播放
2006/10/03 Javascript
用javascript连接access数据库的方法
2006/11/17 Javascript
你未必知道的JavaScript和CSS交互的5种方法
2014/04/02 Javascript
对Web开发中前端框架与前端类库的一些思考
2015/03/27 Javascript
JavaScript的==运算详解
2016/07/20 Javascript
老生常谈js数据类型
2017/08/03 Javascript
js禁止表单重复提交
2017/08/29 Javascript
es6在react中的应用代码解析
2017/11/08 Javascript
Vue 项目代理设置的优化
2018/04/17 Javascript
node.js调用C++函数的方法示例
2018/09/21 Javascript
优雅的使用javascript递归画一棵结构树示例代码
2019/09/22 Javascript
js实现带搜索功能的下拉框
2020/01/11 Javascript
Vue使用vue-draggable 插件在不同列表之间拖拽功能
2020/03/12 Javascript
[20:21]《一刀刀一天》第十六期:TI国际邀请赛正式打响,总奖金超过550万
2014/05/23 DOTA
[06:37]2014DOTA2国际邀请赛 昔日王者渴望重回巅峰
2014/07/12 DOTA
Python是编译运行的验证方法
2015/01/30 Python
PyCharm的设置方法和第一个Python程序的建立
2019/01/16 Python
利用python实现在微信群刷屏的方法
2019/02/21 Python
使用gunicorn部署django项目的问题
2020/12/30 Python
HTML5本地存储之Web Storage应用介绍
2013/01/06 HTML / CSS
类和结构的区别
2012/08/15 面试题
文员个人求职自荐信
2013/09/21 职场文书
大学生个人总结的自我评价
2013/10/05 职场文书
物流管理专业应届生求职信
2013/11/21 职场文书
暑期实习鉴定
2013/12/16 职场文书
四风存在的原因分析
2014/02/11 职场文书
安全生产目标管理责任书
2014/07/25 职场文书
教师群众路线剖析材料
2014/09/29 职场文书
植物园观后感
2015/06/11 职场文书
vue使用v-model进行跨组件绑定的基本实现方法
2021/04/28 Vue.js