Python数据处理的三个实用技巧分享


Posted in Python onApril 01, 2022

我使用的 Pandas 版本如下,顺便也导入 Pandas 库。

>>> import pandas as pd
>>> pd.__version__
'0.25.1'

在开始前先确保解释器和数据集在同一目录下:

>>> import os
>>> os.chdir('D://source/dataset') # 这是我的数据集所在目录
>>> os.listdir() # 确认此目录已经存在 IMDB-Movie-Data 数据集
['drinksbycountry.csv', 'IMDB-Movie-Data.csv', 'movietweetings', 'titanic_eda_data.csv', 'titanic_train_data.csv']

准备工作就位后,正式开始数据处理技巧之旅。

1 Pandas 移除某列

导入数据

>>> df = pd.read_csv("IMDB-Movie-Data.csv")
>>> df.head(1) # 导入并显示第一行
   Rank                    Title                    Genre  ...   Votes Revenue (Millions) Metascore
0     1  Guardians of the Galaxy  Action,Adventure,Sci-Fi  ...  757074             333.13      76.0

[1 rows x 12 columns]

使用 pop 方法移除指定列:

>>> meta = df.pop("Title").to_frame() # 移除 Title 列

确认是否已被移除:

>>> df.head(1) # df 变为 11列
   Rank                    Genre  ... Revenue (Millions) Metascore
0     1  Action,Adventure,Sci-Fi  ...             333.13      76.0

[1 rows x 11 columns]

2 统计标题单词数

pop 后得到 meta,显示 meta 前 3 行:

>>> meta.head(3)
                     Title
0  Guardians of the Galaxy
1               Prometheus
2                    Split

标题是由单词组成,中间用空格分隔。

# .str.count(" ") + 1 得到单词个数 
>>> meta["words_count"] = meta["Title"].str.count(" ") + 1 
>>> meta.head(3) # words_count 列代表单词个数
                     Title  words_count
0  Guardians of the Galaxy            4
1               Prometheus            1
2                    Split            1

3 Genre 频次统计

下面统计电影 Genre 的频次,

>>> vc = df["Genre"].value_counts()

下面显示电影 Genre 的 Top5 ,最高频为出现 50 次的 Action,Adventure,Sci-Fi 类,次之为 48 次的 Drama 类:

>>> vc.head()
Action,Adventure,Sci-Fi    50
Drama                      48
Comedy,Drama,Romance       35
Comedy                     32
Drama,Romance              31
Name: Genre, dtype: int64

展示 Top5 的饼状图:

>>> import matplotlib.pyplot as plt
>>> vc[:5].plot(kind='pie')
<matplotlib.axes._subplots.AxesSubplot object at 0x000001D65B114948>
>>> plt.show()

Python数据处理的三个实用技巧分享

到此这篇关于Python数据处理的三个实用技巧分享的文章就介绍到这了,更多相关Python 数据处理内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
python通过定义一个类实例作为ftp回调方法
May 04 Python
Python3使用PyQt5制作简单的画板/手写板实例
Oct 19 Python
详解python string类型 bytes类型 bytearray类型
Dec 16 Python
Window 64位下python3.6.2环境搭建图文教程
Sep 19 Python
Python使用while循环花式打印乘法表
Jan 28 Python
Python使用sax模块解析XML文件示例
Apr 04 Python
如何在Python中实现goto语句的方法
May 18 Python
python 将字符串完成特定的向右移动方法
Jun 11 Python
parser.add_argument中的action使用
Apr 20 Python
python实现批处理文件
Jul 28 Python
Python3如何使用tabulate打印数据
Sep 25 Python
Python如何使用vars返回对象的属性列表
Oct 17 Python
Python+Tkinter打造签名设计工具
Python正则表达式中flags参数的实例详解
Apr 01 #Python
Python+Tkinter制作专属图形化界面
Pyhton爬虫知识之正则表达式详解
python 离散点图画法的实现
Python学习之迭代器详解
Python实战之大鱼吃小鱼游戏的实现
You might like
第十四节 命名空间 [14]
2006/10/09 PHP
怎样在php中使用PDF文档功能
2006/10/09 PHP
php调用mysql存储过程
2007/02/14 PHP
php 数组的指针操作实现代码
2011/02/08 PHP
PHP仿博客园 个人博客(2) 数据库增添改删
2013/07/05 PHP
php 实现301重定向跳转实例代码
2016/07/18 PHP
Thinkphp 中 distinct 的用法解析
2016/12/14 PHP
PHP的简单跳转提示的实现详解
2019/03/14 PHP
深入认识JavaScript中的函数
2007/01/22 Javascript
获取HTML DOM节点元素的方法的总结
2009/08/21 Javascript
js捕获鼠标右键菜单中的粘帖事件实现代码
2013/04/01 Javascript
如何从jQuery的ajax请求中删除X-Requested-With
2013/12/11 Javascript
JavaScript中Math.SQRT2属性的使用详解
2015/06/14 Javascript
jquery-tips悬浮提示插件分享
2015/07/31 Javascript
五种js判断是否为整数类型方式
2015/12/03 Javascript
微信小程序(应用号)开发新闻客户端实例
2016/10/24 Javascript
Bootstrap CSS布局之图像
2016/12/17 Javascript
Javascript实现登录记住用户名和密码功能
2017/03/22 Javascript
JS轮播图实现简单代码
2021/02/19 Javascript
vue添加锚点,实现滚动页面时锚点添加相应的class操作
2020/08/10 Javascript
Vue的Options用法说明
2020/08/14 Javascript
Python中的高级数据结构详解
2015/03/27 Python
python采集百度百科的方法
2015/06/05 Python
Python3.x爬虫下载网页图片的实例讲解
2018/05/22 Python
python内置数据类型之列表操作
2018/11/12 Python
python的链表基础知识点
2020/09/13 Python
浅谈CSS3中display属性的Flex布局的方法
2017/08/14 HTML / CSS
南非最受欢迎的时尚品牌:MRP
2016/09/18 全球购物
北美个性化礼品商店:Things Remembered
2018/06/12 全球购物
英国异国风情旅游网站:Travel Talk Tours(团体旅游、探险旅游、帆船假期)
2018/07/26 全球购物
婴儿鞋,独特的婴儿服装和配件:Zutano
2018/11/03 全球购物
幼儿园父亲节活动方案
2014/03/11 职场文书
文秘自荐信
2014/06/28 职场文书
家具商场的活动方案
2014/08/16 职场文书
超市店长竞聘书
2015/09/15 职场文书
2019年预备党员的思想汇报:加深对党的认知
2019/09/25 职场文书