编程 Python

python中pandas库中DataFrame对行和列的操作使用方法示例

Posted in Python onJune 14, 2020

用pandas中的DataFrame时选取行或列：

import numpy as np
import pandas as pd
from pandas import Sereis, DataFrame

ser = Series(np.arange(3.))

data = DataFrame(np.arange(16).reshape(4,4),index=list('abcd'),columns=list('wxyz'))

data['w'] #选择表格中的'w'列，使用类字典属性,返回的是Series类型

data.w  #选择表格中的'w'列，使用点属性,返回的是Series类型

data[['w']] #选择表格中的'w'列，返回的是DataFrame类型

data[['w','z']] #选择表格中的'w'、'z'列

data[0:2] #返回第1行到第2行的所有行，前闭后开，包括前不包括后

data[1:2] #返回第2行，从0计，返回的是单行，通过有前后值的索引形式，
    #如果采用data[1]则报错

data.ix[1:2] #返回第2行的第三种方法，返回的是DataFrame，跟data[1:2]同

data['a':'b'] #利用index值进行切片，返回的是**前闭后闭**的DataFrame, 
    #即末端是包含的 

#——————新版本pandas已舍弃该方法，用iloc代替———————
data.irow(0)  #取data的第一行
data.icol(0)  #取data的第一列

ser.iget_value(0) #选取ser序列中的第一个
ser.iget_value(-1) #选取ser序列中的最后一个，这种轴索引包含索引器的series不能采用ser[-1]去获取最后一个，这会引起歧义。
#————————————————————————————-----------------

data.head() #返回data的前几行数据，默认为前五行，需要前十行则data.head(10)
data.tail() #返回data的后几行数据，默认为后五行，需要后十行则data.tail(10)

data.iloc[-1]  #选取DataFrame最后一行，返回的是Series
data.iloc[-1:]  #选取DataFrame最后一行，返回的是DataFrame

data.loc['a',['w','x']]  #返回‘a'行'w'、'x'列，这种用于选取行索引列索引已知

data.iat[1,1]  #选取第二行第二列，用于已知行、列位置的选取。

下面是简单的例子使用验证：

import pandas as pd
from pandas import Series, DataFrame
import numpy as np

data = DataFrame(np.arange(15).reshape(3,5),index=['one','two','three'],columns=['a','b','c','d','e'])

data
Out[7]: 
    a  b  c  d  e
one   0  1  2  3  4
two   5  6  7  8  9
three 10 11 12 13 14

#对列的操作方法有如下几种

data.icol(0)  #选取第一列
E:\Anaconda2\lib\site-packages\spyder\utils\ipython\start_kernel.py:1: FutureWarning: icol(i) is deprecated. Please use .iloc[:,i]
 # -*- coding: utf-8 -*-
Out[35]: 
one    0
two    5
three  10
Name: a, dtype: int32

data['a']
Out[8]: 
one    0
two    5
three  10
Name: a, dtype: int32

data.a
Out[9]: 
one    0
two    5
three  10
Name: a, dtype: int32

data[['a']]
Out[10]: 
    a
one   0
two   5
three 10

data.ix[:,[0,1,2]] #不知道列名只知道列的位置时
Out[13]: 
    a  b  c
one   0  1  2
two   5  6  7
three 10 11 12

data.ix[1,[0]] #选择第2行第1列的值
Out[14]: 
a  5
Name: two, dtype: int32

data.ix[[1,2],[0]]  #选择第2,3行第1列的值
Out[15]: 
    a
two   5
three 10

data.ix[1:3,[0,2]] #选择第2-4行第1、3列的值
Out[17]: 
    a  c
two   5  7
three 10 12

data.ix[1:2,2:4] #选择第2-3行，3-5（不包括5）列的值
Out[29]: 
   c d
two 7 8

data.ix[data.a>5,3]
Out[30]: 
three  13
Name: d, dtype: int32

data.ix[data.b>6,3:4] #选择'b'列中大于6所在的行中的第4列，有点拗口
Out[31]: 
    d
three 13

data.ix[data.a>5,2:4] #选择'a'列中大于5所在的行中的第3-5（不包括5）列
Out[32]: 
    c  d
three 12 13

data.ix[data.a>5,[2,2,2]] #选择'a'列中大于5所在的行中的第2列并重复3次
Out[33]: 
    c  c  c
three 12 12 12

#还可以行数或列数跟行名列名混着用
data.ix[1:3,['a','e']]
Out[24]: 
    a  e
two   5  9
three 10 14

data.ix['one':'two',[2,1]]
Out[25]: 
   c b
one 2 1
two 7 6

data.ix[['one','three'],[2,2]]
Out[26]: 
    c  c
one   2  2
three 12 12

data.ix['one':'three',['a','c']]
Out[27]: 
    a  c
one   0  2
two   5  7
three 10 12

data.ix[['one','one'],['a','e','d','d','d']]
Out[28]: 
   a e d d d
one 0 4 3 3 3
one 0 4 3 3 3

#对行的操作有如下几种：
data[1:2] #（不知道列索引时）选择第2行，不能用data[1]，可以用data.ix[1]
Out[18]: 
   a b c d e
two 5 6 7 8 9

data.irow(1)  #选取第二行
Out[36]: 
a  5
b  6
c  7
d  8
e  9
Name: two, dtype: int32

data.ix[1]  #选择第2行
Out[20]: 
a  5
b  6
c  7
d  8
e  9
Name: two, dtype: int32


data['one':'two'] #当用已知的行索引时为前闭后闭区间，这点与切片稍有不同。
Out[22]: 
   a b c d e
one 0 1 2 3 4
two 5 6 7 8 9

data.ix[1:3] #选择第2到4行，不包括第4行，即前闭后开区间。
Out[23]: 
    a  b  c  d  e
two   5  6  7  8  9
three 10 11 12 13 14

data.ix[-1:] #取DataFrame中最后一行，返回的是DataFrame类型,**注意**这种取法是有使用条件的，只有当行索引不是数字索引时才可以使用，否则可以选用`data[-1:]`--返回DataFrame类型或`data.irow(-1)`--返回Series类型
Out[11]: 
    a  b  c  d  e
three 10 11 12 13 14

data[-1:] #跟上面一样，取DataFrame中最后一行，返回的是DataFrame类型
Out[12]: 
    a  b  c  d  e
three 10 11 12 13 14

data.ix[-1] #取DataFrame中最后一行，返回的是Series类型，这个一样，行索引不能是数字时才可以使用
Out[13]: 
a  10
b  11
c  12
d  13
e  14
Name: three, dtype: int32

data.tail(1)  #返回DataFrame中的最后一行
data.head(1)  #返回DataFrame中的第一行

最近处理数据时发现当pd.read_csv()数据时有时候会有读取到未命名的列，且该列也用不到，一般是索引列被换掉后导致的，有强迫症的看着难受，这时候dataframe.drop([columns,])是没法处理的，怎么办呢，

最笨的方法是直接给列索引重命名：

data6

    Unnamed: 0 high  symbol time
date        
2016-11-01 0  3317.4 IF1611 18:10:44.8
2016-11-01 1  3317.4 IF1611 06:01:04.5
2016-11-01 2  3317.4 IF1611 07:46:25.5
2016-11-01 3  3318.4 IF1611 09:30:04.0
2016-11-01 4  3321.8 IF1611 09:31:04.0

data6.columns = list('abcd')

data6

  a  b  c  d
date        
2016-11-01 0  3317.4 IF1611 18:10:44.8
2016-11-01 1  3317.4 IF1611 06:01:04.5
2016-11-01 2  3317.4 IF1611 07:46:25.5
2016-11-01 3  3318.4 IF1611 09:30:04.0
2016-11-01 4  3321.8 IF1611 09:31:04.0

重新命名后就可以用dataframe.drop([columns])来删除了，当然不用我这样全部给列名替换掉了，可以只是改变未命名的那个列，然后删除。不过这个用起来总是觉得有点low，有没有更好的方法呢，有，可以不去删除，直接：

data7 = data6.ix[:,1:]1

这样既不改变原有数据，也达到了删除神烦列，当然我这里时第0列删除，可以根据实际选择所在的列删除之，至于这个原理，可以看下前面的对列的操作。

github地址

到此这篇关于python中pandas库中DataFrame对行和列的操作使用方法示例的文章就介绍到这了,更多相关pandas库DataFrame行列操作内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木！

python中pandas库中DataFrame对行和列的操作使用方法示例

- Author -

晓东邪

声明：登载此文出于传递更多信息之目的，并不意味着赞同其观点或证实其描述。

Python 相关文章推荐

跟老齐学Python之画圈还不简单吗？

Sep 20 Python

详解Python各大聊天系统的屏蔽脏话功能原理

Dec 01 Python

利用numpy+matplotlib绘图的基本操作教程

May 03 Python

Python实现按当前日期（年、月、日）创建多级目录的方法

Apr 26 Python

pandas筛选某列出现编码错误的解决方法

Nov 07 Python

Python multiprocessing多进程原理与应用示例

Feb 28 Python

对PyQt5的输入对话框使用(QInputDialog)详解

Jun 25 Python

python 设置xlabel,ylabel 坐标轴字体大小,字体类型

Jul 23 Python

django的csrf实现过程详解

Jul 26 Python

django之对FileField字段的upload_to的设定方法

Jul 28 Python

keras绘制acc和loss曲线图实例

Jun 15 Python

Django数据模型中on_delete使用详解

Nov 30 Python

Django 构建模板form表单的两种方法

Jun 14 #Python

Python Django搭建网站流程图解

Jun 13 #Python

Python xpath表达式如何实现数据处理

Jun 13 #Python

Python轻量级web框架bottle使用方法解析

Jun 13 #Python

PyInstaller运行原理及常用操作详解

Jun 13 #Python

Pandas缺失值2种处理方式代码实例

Jun 13 #Python

Python Django中间件使用原理及流程分析

Jun 13 #Python

You might like

php+oracle 分页类

2006/10/09 PHP

在WAMP环境下搭建ZendDebugger php调试工具的方法

2011/07/18 PHP

PHP实现微信网页授权开发教程

2016/01/19 PHP

PHP读取Excel类文件

2017/05/15 PHP

PHP实现基于图的深度优先遍历输出1,2,3...n的全排列功能

2017/11/10 PHP

javascript mouseover、mouseout停止事件冒泡的解决方案

2009/04/07 Javascript

Jquery选中或取消radio示例

2013/09/29 Javascript

JavaScript实现鼠标滑过处生成气泡的方法

2015/05/16 Javascript

jQuery实现dialog设置focus焦点的方法

2015/06/10 Javascript

$.extend 的一个小问题

2015/06/18 Javascript

jquery+css实现的红色线条横向二级菜单效果

2015/08/22 Javascript

JavaScript_ECMA5数组新特性详解

2016/06/12 Javascript

jQuery获取attr()与prop()属性值的方法及区别介绍

2016/07/06 Javascript

JS获取字符串实际长度(包含汉字)的简单方法

2016/08/11 Javascript

JavaScript构建自己的对象示例

2016/11/29 Javascript

jQuery ajax仿Google自动提示SearchSuggess功能示例

2019/03/28 jQuery

微信小程序开发摇一摇功能

2019/11/22 Javascript

node.js开发辅助工具nodemon安装与配置详解

2020/02/06 Javascript

跟老齐学Python之字典，你还记得吗？

2014/09/20 Python

python从网络读取图片并直接进行处理的方法

2015/05/22 Python

基于Python 的进程管理工具supervisor使用指南

2016/09/18 Python

Django 日志配置按日期滚动的方法

2019/01/31 Python

解决pandas展示数据输出时列名不能对齐的问题

2019/11/18 Python

Eclipse配置python默认头过程图解

2020/04/26 Python

Python 使用 PyQt5 开发的关机小工具分享

2020/07/16 Python

Windows下PyCharm配置Anaconda环境(超详细教程)

2020/07/31 Python

python爬虫beautifulsoup库使用操作教程全解(python爬虫基础入门)

2021/02/19 Python

南非最受欢迎的时尚品牌：MRP

2016/09/18 全球购物

澳大利亚首屈一指的在线购物目的地：Kogan.com

2017/02/02 全球购物

大学生实习自我鉴定

2013/12/11 职场文书

篮球比赛拉拉队口号

2014/06/10 职场文书

小学生优秀评语

2014/12/29 职场文书

毕业纪念册寄语大全

2015/02/26 职场文书

2015年助残日活动总结

2015/03/27 职场文书

Java 实战项目之家居购物商城系统详解流程

2021/11/11 Java/Android

CSS控制继承中的height能变为可继承吗

2022/06/10 HTML / CSS