python语言中pandas字符串分割str.split()函数


Posted in Python onAugust 05, 2022

前言

为了介绍python语言中pandas库在数据分析中的重要作用,本人打算以NBA球星勒布朗詹姆斯在2020-2021赛季常规赛个人数据为例对pandas相关函数进行详细说明。利用爬虫技术,在知名篮球网站虎扑爬取了勒布朗詹姆斯的数据,稍后会将数据上传至csdn,以供大家下载。

这篇文章,详细介绍了pandas字符串分割函数---str.split()的用法。

DataFrame.str.split(pa,n,expand)
pat:字符串分隔符,默认为空格。
n:用于指定需要分割的次数,默认为-1。其中,None,0和-1都被解释为返回所有分割的字符串。
expand:将拆分的字符串展开为单独的列,默认为False。

                True:返回DataFrame / MultiIndex;

                False:返回包含字符串列表的Series / Index。

1、常规赛数据格式

勒布朗詹姆斯2020-2021赛季常规赛个人数据的数据结构如下:

日期 对手 比分 时间 投篮 ...
05/17 鹈鹕 110-98(胜) 27 11-22 ...
05/16 步行者 122-115(胜) 28 11-22 ...
... ... ... ... ... ...

2、计算詹姆斯常规赛命中率

勒布朗詹姆斯2020-2021赛季常规赛个人数据中只有每场比赛的命中率,数据的第4列为每场比赛的投篮数和命中数,格式为"命中数-投篮数"。如果想要计算詹姆斯整个常规赛的命中率,则需要算出他常规赛的投篮数和命中数。此时,需要用到pandas分割字符串函数str.split()。

import numpy as np
import pandas as pd
df = pd.read_csv(“lbj-2020-2021-regular.csv”,encoding="gbk")
df0 = df['投篮'].str.split("-",expand=True)
df0.columns = ['命中数','投篮数']

DataFrame类型的df0即为詹姆斯常规赛的命中数和投篮数,如下所示:

0 命中数 投篮数
1 11 22
2 11 22
... ... ...

因为要分别求取命中数和投篮数的总和,所以需要将df0的列转化为整型,继而可得到詹姆斯整个常规赛的命中率。

df0['命中数'] = df0['命中数'].astype('int')
df0['投篮数'] = df0['投篮数'].astype('int')
ShootRate = df0['命中数'].sum() / df0['投篮数'].sum()

计算得到,詹姆斯2020-2021常规赛投篮命中率为51.34%,还是很不错的水平。

总结

到此这篇关于python语言中pandas字符串分割str.split()函数的文章就介绍到这了,更多相关pandas字符串分割str.split()函数内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
python正则表达式re模块详细介绍
May 29 Python
零基础写python爬虫之爬虫编写全记录
Nov 06 Python
python将ip地址转换成整数的方法
Mar 17 Python
Python模拟用户登录验证
Sep 11 Python
详解Python 爬取13个旅游城市,告诉你五一大家最爱去哪玩?
May 07 Python
Python登录系统界面实现详解
Jun 25 Python
python将字母转化为数字实例方法
Oct 04 Python
python栈的基本定义与使用方法示例【初始化、赋值、入栈、出栈等】
Oct 24 Python
Python笔记之代理模式
Nov 20 Python
Django 拼接两个queryset 或是两个不可以相加的对象实例
Mar 28 Python
浅析Python 字符编码与文件处理
Sep 24 Python
python程序的组织结构详解
Dec 06 Python
python绘制云雨图raincloud plot
Aug 05 #Python
python计算列表元素与乘积详情
Aug 05 #Python
Pygame游戏开发之太空射击实战敌人精灵篇
Aug 05 #Python
python playwrigh框架入门安装使用
Jul 23 #Python
python playwright之元素定位示例详解
Jul 23 #Python
Sentry的安装、配置、使用教程(Sentry日志手机系统)
Jul 23 #Python
Python中的 No Module named ***问题及解决
Jul 23 #Python
You might like
天津市收音机工业发展史
2021/03/04 无线电
PHP连接access数据库
2008/03/27 PHP
php 分页函数multi() discuz
2009/06/21 PHP
关于PHP中Session文件过多的问题及session文件保存位置
2016/03/17 PHP
TNC vs RR BO3 第一场 2.14
2021/03/10 DOTA
开发跨浏览器javascript常见注意事项
2009/01/01 Javascript
javascript中的变量是传值还是传址的?
2010/04/19 Javascript
JavaScript 用Node.js写Shell脚本[译]
2012/09/20 Javascript
JavaScript实现网页上的浮动广告的简单方法
2013/06/14 Javascript
jQuery中获取Radio元素值的方法
2013/07/02 Javascript
JavaScript语言核心数据类型和变量使用介绍
2013/08/23 Javascript
js 判断上传文件大小及格式代码
2013/11/13 Javascript
javascript模拟实现ajax加载框实例
2014/10/15 Javascript
AngularJS在IE下取数据总是缓存问题的解决方法
2016/08/05 Javascript
老生常谈javascript的类型转换
2016/10/12 Javascript
jQuery验证表单格式的使用方法
2017/01/10 Javascript
微信小程序 两种为对象属性赋值的方式详解
2017/02/23 Javascript
JSON在Javascript中的使用(eval和JSON.parse的区别)详细解析
2017/09/05 Javascript
详解Vue.js在页面加载时执行某个方法
2018/11/20 Javascript
Vue.js 图标选择组件实践详解
2018/12/03 Javascript
[43:53]OG vs EG 2019国际邀请赛淘汰赛 胜者组 BO3 第三场 8.22
2019/09/05 DOTA
使用python搭建Django应用程序步骤及版本冲突问题解决
2013/11/19 Python
python面向对象法实现图书管理系统
2019/04/19 Python
简单了解Python生成器是什么
2019/07/02 Python
django多对多表的创建,级联删除及手动创建第三张表
2019/07/25 Python
详解python路径拼接os.path.join()函数的用法
2019/10/09 Python
HTML5语音识别标签写法附图
2013/11/18 HTML / CSS
HTML5资源预加载(Link prefetch)详细介绍(给你的网页加速)
2014/05/07 HTML / CSS
Html5 audio标签样式的修改
2016/01/28 HTML / CSS
StubHub新加坡:购买和出售全球活动门票
2017/03/10 全球购物
华纳兄弟工作室的官方授权商店:WB Shop
2018/11/30 全球购物
社团活动策划书范文
2014/01/09 职场文书
物流业务员岗位职责
2014/02/08 职场文书
节约用水演讲稿
2014/05/21 职场文书
护理培训心得体会
2016/01/22 职场文书
win10更新失败无限重启解决方法
2022/04/19 数码科技