编程 Python

python pandas库中DataFrame对行和列的操作实例讲解

Posted in Python onJune 09, 2018

用pandas中的DataFrame时选取行或列：

import numpy as np
import pandas as pd
from pandas import Sereis, DataFrame
ser = Series(np.arange(3.))
data = DataFrame(np.arange(16).reshape(4,4),index=list('abcd'),columns=list('wxyz'))
data['w'] #选择表格中的'w'列，使用类字典属性,返回的是Series类型
data.w #选择表格中的'w'列，使用点属性,返回的是Series类型
data[['w']] #选择表格中的'w'列，返回的是DataFrame类型
data[['w','z']] #选择表格中的'w'、'z'列
data[0:2] #返回第1行到第2行的所有行，前闭后开，包括前不包括后
data[1:2] #返回第2行，从0计，返回的是单行，通过有前后值的索引形式，
  #如果采用data[1]则报错
data.ix[1:2] #返回第2行的第三种方法，返回的是DataFrame，跟data[1:2]同
data['a':'b'] #利用index值进行切片，返回的是**前闭后闭**的DataFrame, 
  #即末端是包含的 
data.irow(0) #取data的第一行
data.icol(0) #取data的第一列
data.head() #返回data的前几行数据，默认为前五行，需要前十行则data.head(10)
data.tail() #返回data的后几行数据，默认为后五行，需要后十行则data.tail(10)
ser.iget_value(0) #选取ser序列中的第一个
ser.iget_value(-1) #选取ser序列中的最后一个，这种轴索引包含索引器的series不能采用ser[-1]去获取最后一个，这会引起歧义。
data.iloc[-1] #选取DataFrame最后一行，返回的是Series
data.iloc[-1:] #选取DataFrame最后一行，返回的是DataFrame
data.loc['a',['w','x']] #返回‘a'行'w'、'x'列，这种用于选取行索引列索引已知
data.iat[1,1] #选取第二行第二列，用于已知行、列位置的选取。

下面是简单的例子使用验证：

import pandas as pd
from pandas import Series, DataFrame
import numpy as np
data = DataFrame(np.arange(15).reshape(3,5),index=['one','two','three'],columns=['a','b','c','d','e'])
data
Out[7]: 
  a b c d e
one  0 1 2 3 4
two  5 6 7 8 9
three 10 11 12 13 14
#对列的操作方法有如下几种
data.icol(0) #选取第一列
E:\Anaconda2\lib\site-packages\spyder\utils\ipython\start_kernel.py:1: FutureWarning: icol(i) is deprecated. Please use .iloc[:,i]
 # -*- coding: utf-8 -*-
Out[35]: 
one  0
two  5
three 10
Name: a, dtype: int32
data['a']
Out[8]: 
one  0
two  5
three 10
Name: a, dtype: int32
data.a
Out[9]: 
one  0
two  5
three 10
Name: a, dtype: int32
data[['a']]
Out[10]: 
  a
one  0
two  5
three 10
data.ix[:,[0,1,2]] #不知道列名只知道列的位置时
Out[13]: 
  a b c
one  0 1 2
two  5 6 7
three 10 11 12
data.ix[1,[0]] #选择第2行第1列的值
Out[14]: 
a 5
Name: two, dtype: int32
data.ix[[1,2],[0]] #选择第2,3行第1列的值
Out[15]: 
  a
two  5
three 10
data.ix[1:3,[0,2]] #选择第2-4行第1、3列的值
Out[17]: 
  a c
two  5 7
three 10 12
data.ix[1:2,2:4] #选择第2-3行，3-5（不包括5）列的值
Out[29]: 
  c d
two 7 8
data.ix[data.a>5,3]
Out[30]: 
three 13
Name: d, dtype: int32
data.ix[data.b>6,3:4] #选择'b'列中大于6所在的行中的第4列，有点拗口
Out[31]: 
  d
three 13
data.ix[data.a>5,2:4] #选择'a'列中大于5所在的行中的第3-5（不包括5）列
Out[32]: 
  c d
three 12 13
data.ix[data.a>5,[2,2,2]] #选择'a'列中大于5所在的行中的第2列并重复3次
Out[33]: 
  c c c
three 12 12 12
#还可以行数或列数跟行名列名混着用
data.ix[1:3,['a','e']]
Out[24]: 
  a e
two  5 9
three 10 14
data.ix['one':'two',[2,1]]
Out[25]: 
  c b
one 2 1
two 7 6
data.ix[['one','three'],[2,2]]
Out[26]: 
  c c
one  2 2
three 12 12
data.ix['one':'three',['a','c']]
Out[27]: 
  a c
one  0 2
two  5 7
three 10 12
data.ix[['one','one'],['a','e','d','d','d']]
Out[28]: 
  a e d d d
one 0 4 3 3 3
one 0 4 3 3 3
#对行的操作有如下几种：
data[1:2] #（不知道列索引时）选择第2行，不能用data[1]，可以用data.ix[1]
Out[18]: 
  a b c d e
two 5 6 7 8 9
data.irow(1) #选取第二行
Out[36]: 
a 5
b 6
c 7
d 8
e 9
Name: two, dtype: int32
data.ix[1] #选择第2行
Out[20]: 
a 5
b 6
c 7
d 8
e 9
Name: two, dtype: int32
data['one':'two'] #当用已知的行索引时为前闭后闭区间，这点与切片稍有不同。
Out[22]: 
  a b c d e
one 0 1 2 3 4
two 5 6 7 8 9
data.ix[1:3] #选择第2到4行，不包括第4行，即前闭后开区间。
Out[23]: 
  a b c d e
two  5 6 7 8 9
three 10 11 12 13 14
data.ix[-1:] #取DataFrame中最后一行，返回的是DataFrame类型,**注意**这种取法是有使用条件的，只有当行索引不是数字索引时才可以使用，否则可以选用`data[-1:]`--返回DataFrame类型或`data.irow(-1)`--返回Series类型
Out[11]: 
  a b c d e
three 10 11 12 13 14
data[-1:] #跟上面一样，取DataFrame中最后一行，返回的是DataFrame类型
Out[12]: 
  a b c d e
three 10 11 12 13 14
data.ix[-1] #取DataFrame中最后一行，返回的是Series类型，这个一样，行索引不能是数字时才可以使用
Out[13]: 
a 10
b 11
c 12
d 13
e 14
Name: three, dtype: int32
data.tail(1) #返回DataFrame中的最后一行
data.head(1) #返回DataFrame中的第一行

最近处理数据时发现当pd.read_csv()数据时有时候会有读取到未命名的列，且该列也用不到，一般是索引列被换掉后导致的，有强迫症的看着难受，这时候dataframe.drop([columns,])是没法处理的，怎么办呢，

最笨的方法是直接给列索引重命名：

data6
  Unnamed: 0 high symbol time
date    
2016-11-01 0 3317.4 IF1611 18:10:44.8
2016-11-01 1 3317.4 IF1611 06:01:04.5
2016-11-01 2 3317.4 IF1611 07:46:25.5
2016-11-01 3 3318.4 IF1611 09:30:04.0
2016-11-01 4 3321.8 IF1611 09:31:04.0
data6.columns = list('abcd')
data6
 a b c d
date    
2016-11-01 0 3317.4 IF1611 18:10:44.8
2016-11-01 1 3317.4 IF1611 06:01:04.5
2016-11-01 2 3317.4 IF1611 07:46:25.5
2016-11-01 3 3318.4 IF1611 09:30:04.0
2016-11-01 4 3321.8 IF1611 09:31:04.0

重新命名后就可以用dataframe.drop([columns])来删除了，当然不用我这样全部给列名替换掉了，可以只是改变未命名的那个列，然后删除。不过这个用起来总是觉得有点low，有没有更好的方法呢，有，可以不去删除，直接：

data7 = data6.ix[:,1:]

这样既不改变原有数据，也达到了删除神烦列，当然我这里时第0列删除，可以根据实际选择所在的列删除之，至于这个原理，可以看下前面的对列的操作。

以上这篇python pandas库中DataFrame对行和列的操作实例讲解就是小编分享给大家的全部内容了，希望能给大家一个参考，也希望大家多多支持三水点靠木。

python pandas库中DataFrame对行和列的操作实例讲解

- Author -

风景不在对岸wj

声明：登载此文出于传递更多信息之目的，并不意味着赞同其观点或证实其描述。

Python 相关文章推荐

Python的Django框架使用入门指引

Apr 15 Python

python获得linux下所有挂载点（mount points）的方法

Apr 29 Python

整理Python中的赋值运算符

May 13 Python

一个基于flask的web应用诞生记录用户账户登录状态（6）

Apr 11 Python

解决PyCharm中光标变粗的问题

Aug 05 Python

Python实现的归并排序算法示例

Nov 21 Python

python调用Delphi写的Dll代码示例

Dec 05 Python

Python发送http请求解析返回json的实例

Mar 26 Python

pygame游戏之旅 python和pygame安装教程

Nov 20 Python

python 执行文件时额外参数获取的实例

Dec 18 Python

python3.6使用SMTP协议发送邮件

May 20 Python

Python中logging日志记录到文件及自动分割的操作代码

Aug 05 Python

python pandas修改列属性的方法详解

Jun 09 #Python

numpy判断数值类型、过滤出数值型数据的方法

Jun 09 #Python

python中使用iterrows()对dataframe进行遍历的实例

Jun 09 #Python

pandas 小数位数精度的处理方法

Jun 09 #Python

Numpy数据类型转换astype,dtype的方法

Jun 09 #Python

Python DataFrame设置/更改列表字段/元素类型的方法

Jun 09 #Python

浅谈DataFrame和SparkSql取值误区

Jun 09 #Python

You might like

PHP 多进程解决难题

2009/06/22 PHP

深入理解php的MySQL连接类

2013/06/07 PHP

php自动获取关键字的方法

2015/01/06 PHP

PHP abstract 抽象类定义与用法示例

2018/05/29 PHP

封装的原生javascript弹出层代码

2010/09/24 Javascript

浏览器兼容console对象的简要解决方案分享

2013/10/24 Javascript

jQuery基于$.ajax设置移动端click超时处理方法

2016/05/14 Javascript

基于MVC5和Bootstrap的jQuery TreeView树形控件(二)之数据支持json字符串、list集合

2016/08/11 Javascript

微信小程序购物商城系统开发系列-目录结构介绍

2016/11/21 Javascript

利用浮层使select不可选的实现方法

2016/12/03 Javascript

bootstrap可编辑下拉框jquery.editable-select

2017/10/12 jQuery

解决VUE中document.body.scrollTop为0的问题

2018/09/15 Javascript

详解如何运行vue项目

2019/04/15 Javascript

Vue.js+cube-ui（Scroll组件）实现类似头条效果的横向滚动导航条

2019/06/24 Javascript

layui清空,重置表单数据的实例

2019/09/12 Javascript

vue中keep-alive、activated的探讨和使用详解

2020/07/26 Javascript

跟老齐学Python之关于循环的小伎俩

2014/10/02 Python

Python的Django框架中的数据过滤功能

2015/07/17 Python

详解Python操作RabbitMQ服务器消息队列的远程结果返回

2016/06/30 Python

ubuntu安装mysql pycharm sublime

2018/02/20 Python

Python生成一个迭代器的实操方法

2019/06/18 Python

python递归法实现简易连连看小游戏

2020/03/25 Python

在Python3 numpy中mean和average的区别详解

2019/08/24 Python

Django中的FBV和CBV用法详解

2019/09/15 Python

在python里使用await关键字来等另外一个协程的实例

2020/05/04 Python

如何通过安装HomeBrew来安装Python3

2020/12/23 Python

铲车司机岗位职责

2014/03/15 职场文书

关于青春的演讲稿800字

2014/08/22 职场文书

商场父亲节活动方案

2014/08/27 职场文书

贫困证明模板（3篇）

2014/09/16 职场文书

基石观后感

2015/06/12 职场文书

《追风筝的人》：人心中的成见是座大山，但请不忘初心

2019/11/15 职场文书

如何在centos上使用yum安装rabbitmq-server

2021/03/31 Servers

一小时迅速入门Mybatis之bind与多数据源支持 Java API

2021/09/15 Javascript

springboot中rabbitmq实现消息可靠性机制详解

2021/09/25 Java/Android

python模板入门教程之flask Jinja

2022/04/11 Python