python pandas库中DataFrame对行和列的操作实例讲解


Posted in Python onJune 09, 2018

用pandas中的DataFrame时选取行或列:

import numpy as np
import pandas as pd
from pandas import Sereis, DataFrame
ser = Series(np.arange(3.))
data = DataFrame(np.arange(16).reshape(4,4),index=list('abcd'),columns=list('wxyz'))
data['w'] #选择表格中的'w'列,使用类字典属性,返回的是Series类型
data.w #选择表格中的'w'列,使用点属性,返回的是Series类型
data[['w']] #选择表格中的'w'列,返回的是DataFrame类型
data[['w','z']] #选择表格中的'w'、'z'列
data[0:2] #返回第1行到第2行的所有行,前闭后开,包括前不包括后
data[1:2] #返回第2行,从0计,返回的是单行,通过有前后值的索引形式,
  #如果采用data[1]则报错
data.ix[1:2] #返回第2行的第三种方法,返回的是DataFrame,跟data[1:2]同
data['a':'b'] #利用index值进行切片,返回的是**前闭后闭**的DataFrame, 
  #即末端是包含的 
data.irow(0) #取data的第一行
data.icol(0) #取data的第一列
data.head() #返回data的前几行数据,默认为前五行,需要前十行则data.head(10)
data.tail() #返回data的后几行数据,默认为后五行,需要后十行则data.tail(10)
ser.iget_value(0) #选取ser序列中的第一个
ser.iget_value(-1) #选取ser序列中的最后一个,这种轴索引包含索引器的series不能采用ser[-1]去获取最后一个,这会引起歧义。
data.iloc[-1] #选取DataFrame最后一行,返回的是Series
data.iloc[-1:] #选取DataFrame最后一行,返回的是DataFrame
data.loc['a',['w','x']] #返回‘a'行'w'、'x'列,这种用于选取行索引列索引已知
data.iat[1,1] #选取第二行第二列,用于已知行、列位置的选取。

下面是简单的例子使用验证:

import pandas as pd
from pandas import Series, DataFrame
import numpy as np
data = DataFrame(np.arange(15).reshape(3,5),index=['one','two','three'],columns=['a','b','c','d','e'])
data
Out[7]: 
  a b c d e
one  0 1 2 3 4
two  5 6 7 8 9
three 10 11 12 13 14
#对列的操作方法有如下几种
data.icol(0) #选取第一列
E:\Anaconda2\lib\site-packages\spyder\utils\ipython\start_kernel.py:1: FutureWarning: icol(i) is deprecated. Please use .iloc[:,i]
 # -*- coding: utf-8 -*-
Out[35]: 
one  0
two  5
three 10
Name: a, dtype: int32
data['a']
Out[8]: 
one  0
two  5
three 10
Name: a, dtype: int32
data.a
Out[9]: 
one  0
two  5
three 10
Name: a, dtype: int32
data[['a']]
Out[10]: 
  a
one  0
two  5
three 10
data.ix[:,[0,1,2]] #不知道列名只知道列的位置时
Out[13]: 
  a b c
one  0 1 2
two  5 6 7
three 10 11 12
data.ix[1,[0]] #选择第2行第1列的值
Out[14]: 
a 5
Name: two, dtype: int32
data.ix[[1,2],[0]] #选择第2,3行第1列的值
Out[15]: 
  a
two  5
three 10
data.ix[1:3,[0,2]] #选择第2-4行第1、3列的值
Out[17]: 
  a c
two  5 7
three 10 12
data.ix[1:2,2:4] #选择第2-3行,3-5(不包括5)列的值
Out[29]: 
  c d
two 7 8
data.ix[data.a>5,3]
Out[30]: 
three 13
Name: d, dtype: int32
data.ix[data.b>6,3:4] #选择'b'列中大于6所在的行中的第4列,有点拗口
Out[31]: 
  d
three 13
data.ix[data.a>5,2:4] #选择'a'列中大于5所在的行中的第3-5(不包括5)列
Out[32]: 
  c d
three 12 13
data.ix[data.a>5,[2,2,2]] #选择'a'列中大于5所在的行中的第2列并重复3次
Out[33]: 
  c c c
three 12 12 12
#还可以行数或列数跟行名列名混着用
data.ix[1:3,['a','e']]
Out[24]: 
  a e
two  5 9
three 10 14
data.ix['one':'two',[2,1]]
Out[25]: 
  c b
one 2 1
two 7 6
data.ix[['one','three'],[2,2]]
Out[26]: 
  c c
one  2 2
three 12 12
data.ix['one':'three',['a','c']]
Out[27]: 
  a c
one  0 2
two  5 7
three 10 12
data.ix[['one','one'],['a','e','d','d','d']]
Out[28]: 
  a e d d d
one 0 4 3 3 3
one 0 4 3 3 3
#对行的操作有如下几种:
data[1:2] #(不知道列索引时)选择第2行,不能用data[1],可以用data.ix[1]
Out[18]: 
  a b c d e
two 5 6 7 8 9
data.irow(1) #选取第二行
Out[36]: 
a 5
b 6
c 7
d 8
e 9
Name: two, dtype: int32
data.ix[1] #选择第2行
Out[20]: 
a 5
b 6
c 7
d 8
e 9
Name: two, dtype: int32
data['one':'two'] #当用已知的行索引时为前闭后闭区间,这点与切片稍有不同。
Out[22]: 
  a b c d e
one 0 1 2 3 4
two 5 6 7 8 9
data.ix[1:3] #选择第2到4行,不包括第4行,即前闭后开区间。
Out[23]: 
  a b c d e
two  5 6 7 8 9
three 10 11 12 13 14
data.ix[-1:] #取DataFrame中最后一行,返回的是DataFrame类型,**注意**这种取法是有使用条件的,只有当行索引不是数字索引时才可以使用,否则可以选用`data[-1:]`--返回DataFrame类型或`data.irow(-1)`--返回Series类型
Out[11]: 
  a b c d e
three 10 11 12 13 14
data[-1:] #跟上面一样,取DataFrame中最后一行,返回的是DataFrame类型
Out[12]: 
  a b c d e
three 10 11 12 13 14
data.ix[-1] #取DataFrame中最后一行,返回的是Series类型,这个一样,行索引不能是数字时才可以使用
Out[13]: 
a 10
b 11
c 12
d 13
e 14
Name: three, dtype: int32
data.tail(1) #返回DataFrame中的最后一行
data.head(1) #返回DataFrame中的第一行

最近处理数据时发现当pd.read_csv()数据时有时候会有读取到未命名的列,且该列也用不到,一般是索引列被换掉后导致的,有强迫症的看着难受,这时候dataframe.drop([columns,])是没法处理的,怎么办呢,

最笨的方法是直接给列索引重命名:

data6
  Unnamed: 0 high symbol time
date    
2016-11-01 0 3317.4 IF1611 18:10:44.8
2016-11-01 1 3317.4 IF1611 06:01:04.5
2016-11-01 2 3317.4 IF1611 07:46:25.5
2016-11-01 3 3318.4 IF1611 09:30:04.0
2016-11-01 4 3321.8 IF1611 09:31:04.0
data6.columns = list('abcd')
data6
 a b c d
date    
2016-11-01 0 3317.4 IF1611 18:10:44.8
2016-11-01 1 3317.4 IF1611 06:01:04.5
2016-11-01 2 3317.4 IF1611 07:46:25.5
2016-11-01 3 3318.4 IF1611 09:30:04.0
2016-11-01 4 3321.8 IF1611 09:31:04.0

重新命名后就可以用dataframe.drop([columns])来删除了,当然不用我这样全部给列名替换掉了,可以只是改变未命名的那个列,然后删除。不过这个用起来总是觉得有点low,有没有更好的方法呢,有,可以不去删除,直接:

data7 = data6.ix[:,1:]

这样既不改变原有数据,也达到了删除神烦列,当然我这里时第0列删除,可以根据实际选择所在的列删除之,至于这个原理,可以看下前面的对列的操作。

以上这篇python pandas库中DataFrame对行和列的操作实例讲解就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Pyhton中防止SQL注入的方法
Feb 05 Python
python编程开发之textwrap文本样式处理技巧
Nov 13 Python
Python并发编程协程(Coroutine)之Gevent详解
Dec 27 Python
Django中间件工作流程及写法实例代码
Feb 06 Python
python实现将读入的多维list转为一维list的方法
Jun 28 Python
Python selenium根据class定位页面元素的方法
Feb 26 Python
django的聚合函数和aggregate、annotate方法使用详解
Jul 23 Python
用python3 urllib破解有道翻译反爬虫机制详解
Aug 14 Python
Python操作SQLite/MySQL/LMDB数据库的方法
Nov 07 Python
python实现一次性封装多条sql语句(begin end)
Jun 06 Python
Python classmethod装饰器原理及用法解析
Oct 17 Python
Pandas数据结构之Series的使用
Mar 31 Python
python pandas修改列属性的方法详解
Jun 09 #Python
numpy判断数值类型、过滤出数值型数据的方法
Jun 09 #Python
python中使用iterrows()对dataframe进行遍历的实例
Jun 09 #Python
pandas 小数位数 精度的处理方法
Jun 09 #Python
Numpy数据类型转换astype,dtype的方法
Jun 09 #Python
Python DataFrame设置/更改列表字段/元素类型的方法
Jun 09 #Python
浅谈DataFrame和SparkSql取值误区
Jun 09 #Python
You might like
我的论坛源代码(二)
2006/10/09 PHP
html中select语句读取mysql表中内容
2006/10/09 PHP
php数组转成json格式的方法
2015/03/09 PHP
完美解决phpdoc导出文档中@package的warning及Error的错误
2016/05/17 PHP
JavaScript 错误处理与调试经验总结
2010/08/10 Javascript
jQuery 源码分析笔记(3) Deferred机制
2011/06/19 Javascript
jQuery中RadioButtonList的功能及用法实例介绍
2013/08/23 Javascript
js事件监听机制(事件捕获)总结
2014/08/08 Javascript
如何减少浏览器的reflow和repaint
2015/02/26 Javascript
JS中call/apply、arguments、undefined/null方法详解
2016/02/15 Javascript
简单谈谈gulp-changed插件
2017/02/21 Javascript
Vue编写多地区选择组件
2017/08/21 Javascript
nodejs 十六进制字符串型数据与btye型数据相互转换
2018/07/30 NodeJs
JavaScript动态创建二维数组的方法示例
2019/02/01 Javascript
Vue CLI 3.x 自动部署项目至服务器的方法
2019/04/02 Javascript
vue中通过使用$attrs实现组件之间的数据传递功能
2019/09/01 Javascript
JS 遍历 json 和 JQuery 遍历json操作完整示例
2019/11/11 jQuery
vue项目使用$router.go(-1)返回时刷新原来的界面操作
2020/07/26 Javascript
React实现全选功能
2020/08/25 Javascript
[01:12:53]完美世界DOTA2联赛PWL S2 Forest vs SZ 第一场 11.25
2020/11/26 DOTA
python实现将英文单词表示的数字转换成阿拉伯数字的方法
2015/07/02 Python
Python的网络编程库Gevent的安装及使用技巧
2016/06/24 Python
浅谈python装饰器探究与参数的领取
2017/12/01 Python
Python Flask框架模板操作实例分析
2019/05/03 Python
python射线法判断检测点是否位于区域外接矩形内
2019/06/28 Python
python3.x+pyqt5实现主窗口状态栏里(嵌入)显示进度条功能
2019/07/04 Python
python分布式编程实现过程解析
2019/11/08 Python
基于opencv的selenium滑动验证码的实现
2020/07/24 Python
图片上传插件ImgUploadJS:用HTML5 File API 实现截图粘贴上传、拖拽上传
2016/01/20 HTML / CSS
阿根廷票务网站:StubHub阿根廷
2018/04/13 全球购物
Zatchels官网:英国剑桥包品牌
2021/01/12 全球购物
投资意向书
2014/07/30 职场文书
小学教师自我剖析材料
2014/09/29 职场文书
学生打架检讨书
2014/10/20 职场文书
工程部主管岗位职责
2015/02/12 职场文书
解决Jupyter-notebook不弹出默认浏览器的问题
2021/03/30 Python