Python数据处理的三个实用技巧分享


Posted in Python onApril 01, 2022

我使用的 Pandas 版本如下,顺便也导入 Pandas 库。

>>> import pandas as pd
>>> pd.__version__
'0.25.1'

在开始前先确保解释器和数据集在同一目录下:

>>> import os
>>> os.chdir('D://source/dataset') # 这是我的数据集所在目录
>>> os.listdir() # 确认此目录已经存在 IMDB-Movie-Data 数据集
['drinksbycountry.csv', 'IMDB-Movie-Data.csv', 'movietweetings', 'titanic_eda_data.csv', 'titanic_train_data.csv']

准备工作就位后,正式开始数据处理技巧之旅。

1 Pandas 移除某列

导入数据

>>> df = pd.read_csv("IMDB-Movie-Data.csv")
>>> df.head(1) # 导入并显示第一行
   Rank                    Title                    Genre  ...   Votes Revenue (Millions) Metascore
0     1  Guardians of the Galaxy  Action,Adventure,Sci-Fi  ...  757074             333.13      76.0

[1 rows x 12 columns]

使用 pop 方法移除指定列:

>>> meta = df.pop("Title").to_frame() # 移除 Title 列

确认是否已被移除:

>>> df.head(1) # df 变为 11列
   Rank                    Genre  ... Revenue (Millions) Metascore
0     1  Action,Adventure,Sci-Fi  ...             333.13      76.0

[1 rows x 11 columns]

2 统计标题单词数

pop 后得到 meta,显示 meta 前 3 行:

>>> meta.head(3)
                     Title
0  Guardians of the Galaxy
1               Prometheus
2                    Split

标题是由单词组成,中间用空格分隔。

# .str.count(" ") + 1 得到单词个数 
>>> meta["words_count"] = meta["Title"].str.count(" ") + 1 
>>> meta.head(3) # words_count 列代表单词个数
                     Title  words_count
0  Guardians of the Galaxy            4
1               Prometheus            1
2                    Split            1

3 Genre 频次统计

下面统计电影 Genre 的频次,

>>> vc = df["Genre"].value_counts()

下面显示电影 Genre 的 Top5 ,最高频为出现 50 次的 Action,Adventure,Sci-Fi 类,次之为 48 次的 Drama 类:

>>> vc.head()
Action,Adventure,Sci-Fi    50
Drama                      48
Comedy,Drama,Romance       35
Comedy                     32
Drama,Romance              31
Name: Genre, dtype: int64

展示 Top5 的饼状图:

>>> import matplotlib.pyplot as plt
>>> vc[:5].plot(kind='pie')
<matplotlib.axes._subplots.AxesSubplot object at 0x000001D65B114948>
>>> plt.show()

Python数据处理的三个实用技巧分享

到此这篇关于Python数据处理的三个实用技巧分享的文章就介绍到这了,更多相关Python 数据处理内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
使用Python3制作TCP端口扫描器
Apr 17 Python
python虚拟环境virtualenv的安装与使用
Sep 21 Python
Python实现模拟登录网易邮箱的方法示例
Jul 05 Python
Flask框架响应、调度方法和蓝图操作实例分析
Jul 24 Python
Python基本socket通信控制操作示例
Jan 30 Python
Python将视频或者动态图gif逐帧保存为图片的方法
Sep 10 Python
Python xlwt模块使用代码实例
Jun 10 Python
python 逆向爬虫正确调用 JAR 加密逻辑
Jan 12 Python
Autopep8的使用(python自动编排工具)
Mar 02 Python
Python .py生成.pyd文件并打包.exe 的注意事项说明
Mar 04 Python
Python爬虫之爬取二手房信息
Apr 27 Python
Python time库的时间时钟处理
May 02 Python
Python+Tkinter打造签名设计工具
Python正则表达式中flags参数的实例详解
Apr 01 #Python
Python+Tkinter制作专属图形化界面
Pyhton爬虫知识之正则表达式详解
python 离散点图画法的实现
Python学习之迭代器详解
Python实战之大鱼吃小鱼游戏的实现
You might like
thinkphp的CURD和查询方式介绍
2013/12/19 PHP
Yii配置文件用法详解
2014/12/04 PHP
php定义参数数量可变的函数用法实例
2015/03/16 PHP
PHP常用排序算法实例小结【基本排序,冒泡排序,快速排序,插入排序】
2017/02/07 PHP
利用PHP内置SERVER开启web服务(本地开发使用)
2020/01/22 PHP
通过Unicode转义序列来加密,按你说的可以算是混淆吧
2007/05/06 Javascript
javascript web对话框与弹出窗口
2009/02/22 Javascript
js整数字符串转换为金额类型数据(示例代码)
2013/12/26 Javascript
JavaScript lastIndexOf方法入门实例(计算指定字符在字符串中最后一次出现的位置)
2014/10/17 Javascript
JavaScript的面向对象编程基础
2015/08/13 Javascript
jQuery幻灯片特效代码分享--鼠标滑过按钮时切换(2)
2020/11/18 Javascript
jQuery控制li上下循环滚动插件用法实例(附demo源码下载)
2016/05/28 Javascript
jsTree使用记录实例
2016/12/01 Javascript
js模糊查询实例分享
2016/12/26 Javascript
js判断手机号是否正确并返回的实现代码
2017/01/17 Javascript
vue bus全局事件中心简单Demo详解
2018/02/26 Javascript
iview通过Dropdown(下拉菜单)实现的右键菜单
2018/10/26 Javascript
vue全局自定义指令-元素拖拽的实现代码
2019/04/14 Javascript
vue项目中常见问题及解决方案(推荐)
2019/10/21 Javascript
[45:38]DOTA2上海特级锦标赛主赛事日 - 1 胜者组第一轮#1Liquid VS Alliance第一局
2016/03/02 DOTA
Python with用法实例
2015/04/14 Python
Python的Flask框架中web表单的教程
2015/04/20 Python
Python处理XML格式数据的方法详解
2017/03/21 Python
利用anaconda作为python的依赖库管理方法
2019/08/13 Python
Python sqlite3查询操作过程解析
2020/02/20 Python
python从PDF中提取数据的示例
2020/10/30 Python
如何安装ruby on rails
2014/02/09 面试题
医护人员英文求职信范文
2013/11/26 职场文书
中秋节超市促销方案
2014/01/30 职场文书
解除劳动合同证明书模板
2014/11/20 职场文书
爱心募捐通知范文
2015/04/27 职场文书
劳动仲裁撤诉申请书
2015/05/18 职场文书
2015年度环卫处工作总结
2015/07/24 职场文书
《检阅》教学反思
2016/02/22 职场文书
vue实现无缝轮播效果(跑马灯)
2021/05/14 Vue.js
JVM钩子函数的使用场景详解
2021/08/23 Java/Android