Python数据处理的三个实用技巧分享


Posted in Python onApril 01, 2022

我使用的 Pandas 版本如下,顺便也导入 Pandas 库。

>>> import pandas as pd
>>> pd.__version__
'0.25.1'

在开始前先确保解释器和数据集在同一目录下:

>>> import os
>>> os.chdir('D://source/dataset') # 这是我的数据集所在目录
>>> os.listdir() # 确认此目录已经存在 IMDB-Movie-Data 数据集
['drinksbycountry.csv', 'IMDB-Movie-Data.csv', 'movietweetings', 'titanic_eda_data.csv', 'titanic_train_data.csv']

准备工作就位后,正式开始数据处理技巧之旅。

1 Pandas 移除某列

导入数据

>>> df = pd.read_csv("IMDB-Movie-Data.csv")
>>> df.head(1) # 导入并显示第一行
   Rank                    Title                    Genre  ...   Votes Revenue (Millions) Metascore
0     1  Guardians of the Galaxy  Action,Adventure,Sci-Fi  ...  757074             333.13      76.0

[1 rows x 12 columns]

使用 pop 方法移除指定列:

>>> meta = df.pop("Title").to_frame() # 移除 Title 列

确认是否已被移除:

>>> df.head(1) # df 变为 11列
   Rank                    Genre  ... Revenue (Millions) Metascore
0     1  Action,Adventure,Sci-Fi  ...             333.13      76.0

[1 rows x 11 columns]

2 统计标题单词数

pop 后得到 meta,显示 meta 前 3 行:

>>> meta.head(3)
                     Title
0  Guardians of the Galaxy
1               Prometheus
2                    Split

标题是由单词组成,中间用空格分隔。

# .str.count(" ") + 1 得到单词个数 
>>> meta["words_count"] = meta["Title"].str.count(" ") + 1 
>>> meta.head(3) # words_count 列代表单词个数
                     Title  words_count
0  Guardians of the Galaxy            4
1               Prometheus            1
2                    Split            1

3 Genre 频次统计

下面统计电影 Genre 的频次,

>>> vc = df["Genre"].value_counts()

下面显示电影 Genre 的 Top5 ,最高频为出现 50 次的 Action,Adventure,Sci-Fi 类,次之为 48 次的 Drama 类:

>>> vc.head()
Action,Adventure,Sci-Fi    50
Drama                      48
Comedy,Drama,Romance       35
Comedy                     32
Drama,Romance              31
Name: Genre, dtype: int64

展示 Top5 的饼状图:

>>> import matplotlib.pyplot as plt
>>> vc[:5].plot(kind='pie')
<matplotlib.axes._subplots.AxesSubplot object at 0x000001D65B114948>
>>> plt.show()

Python数据处理的三个实用技巧分享

到此这篇关于Python数据处理的三个实用技巧分享的文章就介绍到这了,更多相关Python 数据处理内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
使用python实现生成用户信息
Mar 20 Python
pytorch cnn 识别手写的字实现自建图片数据
May 20 Python
Python中安装easy_install的方法
Nov 18 Python
python实现nao机器人身体躯干和腿部动作操作
Apr 29 Python
Django框架首页和登录页分离操作示例
May 28 Python
Django模型序列化返回自然主键值示例代码
Jun 12 Python
Python 堆叠柱状图绘制方法
Jul 29 Python
关于Python3 类方法、静态方法新解
Aug 30 Python
python爬虫数据保存到mongoDB的实例方法
Jul 28 Python
Python如何给函数库增加日志功能
Aug 04 Python
python环境搭建和pycharm的安装配置及汉化详细教程(零基础小白版)
Aug 19 Python
Python操控mysql批量插入数据的实现方法
Oct 27 Python
Python+Tkinter打造签名设计工具
Python正则表达式中flags参数的实例详解
Apr 01 #Python
Python+Tkinter制作专属图形化界面
Pyhton爬虫知识之正则表达式详解
python 离散点图画法的实现
Python学习之迭代器详解
Python实战之大鱼吃小鱼游戏的实现
You might like
Symfony2安装第三方Bundles实例详解
2016/02/04 PHP
imagettftext() 失效,不起作用
2021/03/09 PHP
javascript 子窗体父窗体相互传值方法
2010/05/31 Javascript
javascript数字数组去重复项的实现代码
2010/12/30 Javascript
JQuery将文本转化成JSON对象需要注意的问题
2011/05/09 Javascript
jquery parent和parents的区别分析
2013/10/02 Javascript
深入分析Javascript跨域问题
2015/04/17 Javascript
JavaScript中的toLocaleLowerCase()方法使用详解
2015/06/06 Javascript
jQuery实现复选框批量选择与反选的方法
2015/06/17 Javascript
第三章之Bootstrap 表格与按钮功能
2016/04/25 Javascript
JQuery的Pager分页器实现代码
2016/05/03 Javascript
AngularJS基础 ng-copy 指令实例代码
2016/08/01 Javascript
js模式化窗口问题![window.dialogArguments]
2016/10/30 Javascript
利用纯Vue.js构建Bootstrap组件
2016/11/03 Javascript
Jquery给当前页或者跳转后页面的导航栏添加选中后样式的实例
2016/12/08 Javascript
jQuery实现简单日期格式化功能示例
2017/09/19 jQuery
微信小程序表单验证form提交错误提示效果
2020/06/19 Javascript
新手快速入门微信小程序组件库 iView Weapp
2019/06/24 Javascript
js实现验证码干扰(动态)
2021/02/23 Javascript
[05:20]2018DOTA2亚洲邀请赛主赛事第三日战况回顾 LGD率先挺进胜者组决赛
2018/04/06 DOTA
python算法学习之桶排序算法实例(分块排序)
2013/12/18 Python
python实现博客文章爬虫示例
2014/02/26 Python
Python的Twisted框架中使用Deferred对象来管理回调函数
2016/05/25 Python
Python实现视频下载功能
2017/03/14 Python
python SMTP实现发送带附件电子邮件
2018/05/22 Python
Pycharm 设置自定义背景颜色的图文教程
2018/05/23 Python
Python从list类型、range()序列简单认识类(class)【可迭代】
2019/05/31 Python
python对 MySQL 数据库进行增删改查的脚本
2020/10/22 Python
CSS3 简写animation
2012/05/10 HTML / CSS
智能室内花园:Click & Grow
2021/01/29 全球购物
高中生的自我评价
2014/03/04 职场文书
给老师的一封感谢信
2015/01/20 职场文书
教师年度个人总结
2015/02/11 职场文书
法律讲堂观后感
2015/06/11 职场文书
eclipse创建项目没有dynamic web的解决方法
2021/06/24 Java/Android
MySQL创建定时任务
2022/01/22 MySQL