用pandas中的DataFrame时选取行或列的方法


Posted in Python onJuly 11, 2018

如下所示:

import numpy as np
import pandas as pd
from pandas import Sereis, DataFrame
ser = Series(np.arange(3.))
data = DataFrame(np.arange(16).reshape(4,4),index=list('abcd'),columns=list('wxyz'))
data['w'] #选择表格中的'w'列,使用类字典属性,返回的是Series类型
data.w  #选择表格中的'w'列,使用点属性,返回的是Series类型
data[['w']] #选择表格中的'w'列,返回的是DataFrame属性
data[['w','z']] #选择表格中的'w'、'z'列
data[0:2] #返回第1行到第2行的所有行,前闭后开,包括前不包括后
data[1:2] #返回第2行,从0计,返回的是单行,通过有前后值的索引形式,
    #如果采用data[1]则报错
data.ix[1:2] #返回第2行的第三种方法,返回的是DataFrame,跟data[1:2]同
data['a':'b'] #利用index值进行切片,返回的是**前闭后闭**的DataFrame, 
    #即末端是包含的 
data.irow(0)  #取data的第一行
data.icol(0)  #取data的第一列
data.head() #返回data的前几行数据,默认为前五行,需要前十行则dta.head(10)
data.tail() #返回data的后几行数据,默认为后五行,需要后十行则data.tail(10)
ser.iget_value(0) #选取ser序列中的第一个
ser.iget_value(-1) #选取ser序列中的最后一个,这种轴索引包含索引器的series不能采用ser[-1]去获取最后一个,这回引起歧义。
data.iloc[-1]  #选取DataFrame最后一行,返回的是Series
data.iloc[-1:]  #选取DataFrame最后一行,返回的是DataFrame
data.loc['a',['w','x']]  #返回‘a'行'w'、'x'列,这种用于选取行索引列索引已知
data.iat[1,1]  #选取第二行第二列,用于已知行、列位置的选取。

例子:

import pandas as pd
from pandas import Series, DataFrame
import numpy as np
data = DataFrame(np.arange(15).reshape(3,5),index=['one','two','three'],columns=['a','b','c','d','e'])
data
Out[7]: 
    a  b  c  d  e
one   0  1  2  3  4
two   5  6  7  8  9
three 10 11 12 13 14
#对列的操作方法有如下几种
data.icol(0)  #选取第一列
E:\Anaconda2\lib\site-packages\spyder\utils\ipython\start_kernel.py:1: FutureWarning: icol(i) is deprecated. Please use .iloc[:,i]
 # -*- coding: utf-8 -*-
Out[35]: 
one    0
two    5
three  10
Name: a, dtype: int32
data['a']
Out[8]: 
one    0
two    5
three  10
Name: a, dtype: int32
data.a
Out[9]: 
one    0
two    5
three  10
Name: a, dtype: int32
data[['a']]
Out[10]: 
    a
one   0
two   5
three 10
data.ix[:,[0,1,2]] #不知道列名只知道列的位置时
Out[13]: 
    a  b  c
one   0  1  2
two   5  6  7
three 10 11 12
data.ix[1,[0]] #选择第2行第1列的值
Out[14]: 
a  5
Name: two, dtype: int32
data.ix[[1,2],[0]]  #选择第2,3行第1列的值
Out[15]: 
    a
two   5
three 10
data.ix[1:3,[0,2]] #选择第2-4行第1、3列的值
Out[17]: 
    a  c
two   5  7
three 10 12
data.ix[1:2,2:4] #选择第2-3行,3-5(不包括5)列的值
Out[29]: 
   c d
two 7 8
data.ix[data.a>5,3]
Out[30]: 
three  13
Name: d, dtype: int32
data.ix[data.b>6,3:4] #选择'b'列中大于6所在的行中的第4列,有点拗口
Out[31]: 
    d
three 13
data.ix[data.a>5,2:4] #选择'a'列中大于5所在的行中的第3-5(不包括5)列
Out[32]: 
    c  d
three 12 13
data.ix[data.a>5,[2,2,2]] #选择'a'列中大于5所在的行中的第2列并重复3次
Out[33]: 
    c  c  c
three 12 12 12
#还可以行数或列数跟行名列名混着用
data.ix[1:3,['a','e']]
Out[24]: 
    a  e
two   5  9
three 10 14
data.ix['one':'two',[2,1]]
Out[25]: 
   c b
one 2 1
two 7 6
data.ix[['one','three'],[2,2]]
Out[26]: 
    c  c
one   2  2
three 12 12
data.ix['one':'three',['a','c']]
Out[27]: 
    a  c
one   0  2
two   5  7
three 10 12
data.ix[['one','one'],['a','e','d','d','d']]
Out[28]: 
   a e d d d
one 0 4 3 3 3
one 0 4 3 3 3
#对行的操作有如下几种:
data[1:2] #(不知道列索引时)选择第2行,不能用data[1],可以用data.ix[1]
Out[18]: 
   a b c d e
two 5 6 7 8 9
data.irow(1)  #选取第二行
E:\Anaconda2\lib\site-packages\spyder\utils\ipython\start_kernel.py:1: FutureWarning: irow(i) is deprecated. Please use .iloc[i]
 # -*- coding: utf-8 -*-
Out[36]: 
a  5
b  6
c  7
d  8
e  9
Name: two, dtype: int32
data.ix[1]  #选择第2行
Out[20]: 
a  5
b  6
c  7
d  8
e  9
Name: two, dtype: int32

data['one':'two'] #当用已知的行索引时为前闭后闭区间,这点与切片稍有不同。
Out[22]: 
   a b c d e
one 0 1 2 3 4
two 5 6 7 8 9
data.ix[1:3] #选择第2到4行,不包括第4行,即前闭后开区间。
Out[23]: 
    a  b  c  d  e
two   5  6  7  8  9
three 10 11 12 13 14
data.ix[-1:] #取DataFrame中最后一行,返回的是DataFrame类型,**注意**这种取法是有使用条件的,只有当行索引不是数字索引时才可以使用,否则可以选用`data[-1:]`--返回DataFrame类型或`data.irow(-1)`--返回Series类型
Out[11]: 
    a  b  c  d  e
three 10 11 12 13 14
data[-1:] #跟上面一样,取DataFrame中最后一行,返回的是DataFrame类型
Out[12]: 
    a  b  c  d  e
three 10 11 12 13 14
data.ix[-1] #取DataFrame中最后一行,返回的是Series类型,这个一样,行索引不能是数字时才可以使用
Out[13]: 
a  10
b  11
c  12
d  13
e  14
Name: three, dtype: int32
data.tail(1)  #返回DataFrame中的最后一行
data.head(1)  #返回DataFrame中的第一行

最近处理数据时发现当pd.read_csv()数据时有时候会有读取到未命名的列,且该列也用不到,一般是索引列被换掉后导致的,有强迫症的看着难受,这时候dataframe.drop([columns,])是没法处理的,怎么办呢,

最笨的方法是直接给列索引重命名:

data6
    Unnamed: 0 high  symbol time
date        
2016-11-01 0  3317.4 IF1611 18:10:44.8
2016-11-01 1  3317.4 IF1611 06:01:04.5
2016-11-01 2  3317.4 IF1611 07:46:25.5
2016-11-01 3  3318.4 IF1611 09:30:04.0
2016-11-01 4  3321.8 IF1611 09:31:04.0

data6.columns = list('abcd')
data6
  a  b  c  d
date        
2016-11-01 0  3317.4 IF1611 18:10:44.8
2016-11-01 1  3317.4 IF1611 06:01:04.5
2016-11-01 2  3317.4 IF1611 07:46:25.5
2016-11-01 3  3318.4 IF1611 09:30:04.0
2016-11-01 4  3321.8 IF1611 09:31:04.0

以上这篇用pandas中的DataFrame时选取行或列的方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python  pip安装lxml出错的问题解决办法
Feb 10 Python
对python字典过滤条件的实例详解
Jan 22 Python
Python应用领域和就业形势分析总结
May 14 Python
8种用Python实现线性回归的方法对比详解
Jul 10 Python
python中selenium操作下拉滚动条的几种方法汇总
Jul 14 Python
Django 解决由save方法引发的错误
May 21 Python
python中rc1什么意思
Jun 19 Python
Python基于内置函数type创建新类型
Oct 22 Python
Python爬虫之App爬虫视频下载的实现
Dec 08 Python
Pandas数据分析的一些常用小技巧
Feb 07 Python
 Python 中 logging 模块使用详情
Mar 03 Python
python解析json数据
Apr 29 Python
Python2实现的图片文本识别功能详解
Jul 11 #Python
利用Python进行数据可视化常见的9种方法!超实用!
Jul 11 #Python
基于数据归一化以及Python实现方式
Jul 11 #Python
numpy.std() 计算矩阵标准差的方法
Jul 11 #Python
使用sklearn进行对数据标准化、归一化以及将数据还原的方法
Jul 11 #Python
使用sklearn之LabelEncoder将Label标准化的方法
Jul 11 #Python
Python实现识别图片内容的方法分析
Jul 11 #Python
You might like
ThinkPHP基本的增删查改操作实例教程
2014/08/22 PHP
Yii框架中 find findAll 查找出制定的字段的方法对比
2014/09/10 PHP
PHP几个实用自定义函数小结
2016/01/25 PHP
详解PHP原生DOM对象操作XML的方法
2016/10/17 PHP
javascript 24小时弹出一次的代码(利用cookies)
2009/09/03 Javascript
Jquery仿淘宝京东多条件筛选可自行结合ajax加载示例
2013/08/28 Javascript
js克隆对象、数组的常用方法介绍
2013/09/26 Javascript
PHP开发者必须掌握的6个关键字
2014/04/14 Javascript
jquery实现相册一下滑动两次的方法
2015/02/09 Javascript
不同编码的页面表单数据乱码问题解决方法
2015/02/15 Javascript
jquery实现仿新浪微博带动画效果弹出层代码(可关闭、可拖动)
2015/10/12 Javascript
Bootstrap轮播加上css3动画,炫酷到底!
2015/12/22 Javascript
Canvas 制作动态进度加载水球详解及实例代码
2016/12/09 Javascript
JS实现的找零张数最小问题示例
2017/11/28 Javascript
js操作二进制数据方法
2018/03/03 Javascript
关于vue3默认把所有onSomething当作v-on事件绑定的思考
2020/05/15 Javascript
js获取url页面id,也就是最后的数字文件名
2020/09/25 Javascript
详解Vue的异步更新实现原理
2020/12/22 Vue.js
微信跳一跳辅助python代码实现
2018/01/05 Python
学习Python selenium自动化网页抓取器
2018/01/20 Python
在python win系统下 打开TXT文件的实例
2018/04/29 Python
python实现画五角星和螺旋线的示例
2019/01/20 Python
Python中and和or如何使用
2020/05/28 Python
浅谈TensorFlow之稀疏张量表示
2020/06/30 Python
Python3爬虫mitmproxy的安装步骤
2020/07/29 Python
Python中的None与 NULL(即空字符)的区别详解
2020/09/24 Python
html5时钟实现代码
2010/10/22 HTML / CSS
html5中valid、invalid、required的定义
2014/02/21 HTML / CSS
德国百年厨具品牌WMF美国站:WMF美国
2016/09/12 全球购物
请解释一下webService? 如何用.net实现webService
2014/06/09 面试题
C#公司笔试题
2014/03/28 面试题
C#里面如何倒序排列一个数组的元素?
2013/06/21 面试题
领导干部四风问题自我剖析材料
2014/09/25 职场文书
典型事迹材料范文
2014/12/29 职场文书
离婚起诉书范文2016
2015/11/26 职场文书
win11怎么用快捷键锁屏? windows11锁屏的几种方法
2021/11/21 数码科技