进行数据处理的6个 Python 代码块分享


Posted in Python onApril 06, 2022

前言:

大家好,今天和大家分享自己总结的6个常用的 Python 数据处理代码,对于经常处理数据的coder最好熟练掌握。

1、选取有空值的行

在观察数据结构时,该方法可以快速定位存在缺失值的行。

df = pd.DataFrame({'A': [0, 1, 2],
                   'B': [0, 1, None],
                   'C': [0, None, 2]})
df[df.isnull().T.any()]

输出:

  A   B   C           A   B   C
0 0 0.0 0.0         1 1 1.0 NaN
1 1 1.0 NaN   -->   2 2 NaN 2.0
2 2 NaN 2.0

2、快速替换列值

实际数据处理经常会根据一些限定条件来替换列中的值。

df = pd.DataFrame({'name':['Python', 'Java', 'C']})

# 第一种方式
df['name'].replace('Java', 'JavaScript', inplace=True)
# 第二种方式
df.loc[df['name'].str.contains('Java'), 'name'] = 'JavaScript'

输出:

     name                   name
0  Python          0      Python
1    Java    --->  1  JavaScript
2       C          2           C

3、对列进行分区

很多情况下,对于数值类型的数据,我们需要分区来计算每个区间数据出现的频率。这时用 pd.cut 就能很好的解决这一问题。

import random

age = random.sample(range(90), 20)
cut_res = pd.cut(age, bins=[0, 18, 35, 60, 90])
# cut_res type:<class 'pandas.core.arrays.categorical.Categorical'>
cut_res.value_counts()

输出:

(0, 18]     6
(18, 35]    1
(35, 60]    6
(60, 90]    7

4、将一列分为多列

在文本数据清洗时,一些列中存在分隔符(‘’, ‘,’, ‘:’)分隔的值,我们只需将该列根据分隔符进行 split 即可。

import pandas as pd

df = pd.DataFrame({'address': ['四川省 成都市',
                               '湖北省 武汉市',
                               '浙江省 杭州市']})
res = df['address'].str.split(' ', expand=True)  
res.columns = ['province', 'city']

输出:

  province city
0 四川省    成都市
1 湖北省    武汉市
2 浙江省    杭州市

expand参数选择是否扩展为 DataFrame,False 则返回 Series

5、中文筛选

同样在清洗过程中,往往会出现一些不需要的中文字段,这时直接用 str.contains 筛选即可。

df = pd.DataFrame({'mobile_phone':
                   ['15928765644',
                    '15567332235',
                    '暂无']})
df[~df['mobile_phone'].str.contains('[\u4e00-\u9fa5]')]

输出:

  mobile_phone         mobile_phone
0 15928765644        0 15928765644
1 15567332235   -->  1 15567332235
2 暂无

6、更改列的位置

有时我们需要调整列的位置,当数据列较少时,可以用下面的方式

df = pd.DataFrame({'name': ['A', 'B', 'C'],
                   'age': [10, 20, 30],
                   'gender': [0, 1, 0]})
df = df[['name', 'gender', 'age']]

输出:

 name age gender    name gender age
0   A  10 0        0   A 0       10
1   B  20 1   -->  1   B 1       20
2   C  30 0        2   C 0       30

如果列较多,那么,一个个列举出来会比较繁琐,推荐下面插入的方式。

col = df['gender']
df.drop('gender', axis=1, inplace=True)
df.insert(1, 'gender', col)

到此这篇关于进行数据处理的6个 Python 代码块分享的文章就介绍到这了,更多相关Python 数据处理内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
Python splitlines使用技巧
Sep 06 Python
详细解析Python中的变量的数据类型
May 13 Python
python链接Oracle数据库的方法
Jun 28 Python
pygame实现俄罗斯方块游戏
Jun 26 Python
Python中最大递归深度值的探讨
Mar 05 Python
python实现银行管理系统
Oct 25 Python
手动安装python3.6的操作过程详解
Jan 13 Python
通过实例解析Python return运行原理
Mar 04 Python
Python计算指定日期是今年的第几天(三种方法)
Mar 26 Python
Django分组聚合查询实例分享
Apr 29 Python
python 实现端口扫描工具
Dec 18 Python
python+opencv实现车道线检测
Feb 19 Python
 分享一个Python 遇到数据库超好用的模块
Apr 06 #Python
Python利用capstone实现反汇编
关于Python中进度条的六个实用技巧分享
如何在Python中妥善使用进度条详解
Apr 05 #Python
Python接口自动化之文件上传/下载接口详解
Apr 05 #Python
关于python3 opencv 图像二值化的问题(cv2.adaptiveThreshold函数)
Python中使用Opencv开发停车位计数器功能
You might like
PHP中的cookie
2006/11/26 PHP
php结合表单实现一些简单功能的例子
2011/06/04 PHP
smarty模板引擎中自定义函数的方法
2015/01/22 PHP
Ubuntu上安装yaf扩展的方法
2018/01/29 PHP
Laravel 微信小程序后端搭建步骤详解
2019/11/26 PHP
js面向对象设计用{}好还是function(){}好(构造函数)
2011/10/23 Javascript
通过Javascript将数据导出到外部Excel文档的函数代码
2012/06/15 Javascript
一个简单的Node.js异步操作管理器分享
2014/04/29 Javascript
javascript使用smipleChart实现简单图表
2015/01/02 Javascript
基于Jquery实现表单验证
2020/07/20 Javascript
javascript特殊日历控件分享
2016/03/07 Javascript
JavaScript中自带的 reduce()方法使用示例详解
2016/08/10 Javascript
JavaScript 是什么意思
2016/09/22 Javascript
hovertree插件实现二级树形菜单(简单实用)
2016/12/28 Javascript
Vue数据驱动模拟实现2
2017/01/11 Javascript
JS中this的指向以及call、apply的作用
2018/05/06 Javascript
vue动态配置模板 'component is'代码
2019/07/04 Javascript
es6中reduce的基本使用方法
2019/09/10 Javascript
[43:32]Winstrike vs VGJ.S 2018国际邀请赛淘汰赛BO3 第一场 8.23
2018/08/24 DOTA
[58:59]完美世界DOTA2联赛PWL S3 access vs CPG 第一场 12.13
2020/12/16 DOTA
Python中的jquery PyQuery库使用小结
2014/05/13 Python
python开发之list操作实例分析
2016/02/22 Python
Python2.7+pytesser实现简单验证码的识别方法
2017/12/29 Python
Python绘制正余弦函数图像的方法
2018/08/28 Python
Django Sitemap 站点地图的实现方法
2019/04/29 Python
Pycharm创建项目时如何自动添加头部信息
2019/11/14 Python
如何利用python 读取配置文件
2021/01/06 Python
荷兰天然和有机产品网上商城:BigGreenSmile.nl
2020/07/26 全球购物
新加坡第一的杂货零售商:NTUC FairPrice
2020/12/05 全球购物
幼儿园教师工作制度
2014/01/22 职场文书
大二法英学生职业生涯规划范文
2014/02/27 职场文书
《果园机器人》教学反思
2014/04/13 职场文书
党的群众路线教育实践活动制度建设计划方案
2014/10/31 职场文书
婚礼迎宾词大全
2015/08/10 职场文书
解决Golang中ResponseWriter的一个坑
2021/04/27 Golang
React-vscode使用jsx语法的问题及解决方法
2021/06/21 Javascript