python中pandas库中DataFrame对行和列的操作使用方法示例


Posted in Python onJune 14, 2020

用pandas中的DataFrame时选取行或列:

import numpy as np
import pandas as pd
from pandas import Sereis, DataFrame

ser = Series(np.arange(3.))

data = DataFrame(np.arange(16).reshape(4,4),index=list('abcd'),columns=list('wxyz'))

data['w'] #选择表格中的'w'列,使用类字典属性,返回的是Series类型

data.w  #选择表格中的'w'列,使用点属性,返回的是Series类型

data[['w']] #选择表格中的'w'列,返回的是DataFrame类型

data[['w','z']] #选择表格中的'w'、'z'列

data[0:2] #返回第1行到第2行的所有行,前闭后开,包括前不包括后

data[1:2] #返回第2行,从0计,返回的是单行,通过有前后值的索引形式,
    #如果采用data[1]则报错

data.ix[1:2] #返回第2行的第三种方法,返回的是DataFrame,跟data[1:2]同

data['a':'b'] #利用index值进行切片,返回的是**前闭后闭**的DataFrame, 
    #即末端是包含的 

#——————新版本pandas已舍弃该方法,用iloc代替———————
data.irow(0)  #取data的第一行
data.icol(0)  #取data的第一列

ser.iget_value(0) #选取ser序列中的第一个
ser.iget_value(-1) #选取ser序列中的最后一个,这种轴索引包含索引器的series不能采用ser[-1]去获取最后一个,这会引起歧义。
#————————————————————————————-----------------

data.head() #返回data的前几行数据,默认为前五行,需要前十行则data.head(10)
data.tail() #返回data的后几行数据,默认为后五行,需要后十行则data.tail(10)

data.iloc[-1]  #选取DataFrame最后一行,返回的是Series
data.iloc[-1:]  #选取DataFrame最后一行,返回的是DataFrame

data.loc['a',['w','x']]  #返回‘a'行'w'、'x'列,这种用于选取行索引列索引已知

data.iat[1,1]  #选取第二行第二列,用于已知行、列位置的选取。

下面是简单的例子使用验证:

import pandas as pd
from pandas import Series, DataFrame
import numpy as np

data = DataFrame(np.arange(15).reshape(3,5),index=['one','two','three'],columns=['a','b','c','d','e'])

data
Out[7]: 
    a  b  c  d  e
one   0  1  2  3  4
two   5  6  7  8  9
three 10 11 12 13 14

#对列的操作方法有如下几种

data.icol(0)  #选取第一列
E:\Anaconda2\lib\site-packages\spyder\utils\ipython\start_kernel.py:1: FutureWarning: icol(i) is deprecated. Please use .iloc[:,i]
 # -*- coding: utf-8 -*-
Out[35]: 
one    0
two    5
three  10
Name: a, dtype: int32

data['a']
Out[8]: 
one    0
two    5
three  10
Name: a, dtype: int32

data.a
Out[9]: 
one    0
two    5
three  10
Name: a, dtype: int32

data[['a']]
Out[10]: 
    a
one   0
two   5
three 10

data.ix[:,[0,1,2]] #不知道列名只知道列的位置时
Out[13]: 
    a  b  c
one   0  1  2
two   5  6  7
three 10 11 12

data.ix[1,[0]] #选择第2行第1列的值
Out[14]: 
a  5
Name: two, dtype: int32

data.ix[[1,2],[0]]  #选择第2,3行第1列的值
Out[15]: 
    a
two   5
three 10

data.ix[1:3,[0,2]] #选择第2-4行第1、3列的值
Out[17]: 
    a  c
two   5  7
three 10 12

data.ix[1:2,2:4] #选择第2-3行,3-5(不包括5)列的值
Out[29]: 
   c d
two 7 8

data.ix[data.a>5,3]
Out[30]: 
three  13
Name: d, dtype: int32

data.ix[data.b>6,3:4] #选择'b'列中大于6所在的行中的第4列,有点拗口
Out[31]: 
    d
three 13

data.ix[data.a>5,2:4] #选择'a'列中大于5所在的行中的第3-5(不包括5)列
Out[32]: 
    c  d
three 12 13

data.ix[data.a>5,[2,2,2]] #选择'a'列中大于5所在的行中的第2列并重复3次
Out[33]: 
    c  c  c
three 12 12 12

#还可以行数或列数跟行名列名混着用
data.ix[1:3,['a','e']]
Out[24]: 
    a  e
two   5  9
three 10 14

data.ix['one':'two',[2,1]]
Out[25]: 
   c b
one 2 1
two 7 6

data.ix[['one','three'],[2,2]]
Out[26]: 
    c  c
one   2  2
three 12 12

data.ix['one':'three',['a','c']]
Out[27]: 
    a  c
one   0  2
two   5  7
three 10 12

data.ix[['one','one'],['a','e','d','d','d']]
Out[28]: 
   a e d d d
one 0 4 3 3 3
one 0 4 3 3 3

#对行的操作有如下几种:
data[1:2] #(不知道列索引时)选择第2行,不能用data[1],可以用data.ix[1]
Out[18]: 
   a b c d e
two 5 6 7 8 9

data.irow(1)  #选取第二行
Out[36]: 
a  5
b  6
c  7
d  8
e  9
Name: two, dtype: int32

data.ix[1]  #选择第2行
Out[20]: 
a  5
b  6
c  7
d  8
e  9
Name: two, dtype: int32


data['one':'two'] #当用已知的行索引时为前闭后闭区间,这点与切片稍有不同。
Out[22]: 
   a b c d e
one 0 1 2 3 4
two 5 6 7 8 9

data.ix[1:3] #选择第2到4行,不包括第4行,即前闭后开区间。
Out[23]: 
    a  b  c  d  e
two   5  6  7  8  9
three 10 11 12 13 14

data.ix[-1:] #取DataFrame中最后一行,返回的是DataFrame类型,**注意**这种取法是有使用条件的,只有当行索引不是数字索引时才可以使用,否则可以选用`data[-1:]`--返回DataFrame类型或`data.irow(-1)`--返回Series类型
Out[11]: 
    a  b  c  d  e
three 10 11 12 13 14

data[-1:] #跟上面一样,取DataFrame中最后一行,返回的是DataFrame类型
Out[12]: 
    a  b  c  d  e
three 10 11 12 13 14

data.ix[-1] #取DataFrame中最后一行,返回的是Series类型,这个一样,行索引不能是数字时才可以使用
Out[13]: 
a  10
b  11
c  12
d  13
e  14
Name: three, dtype: int32

data.tail(1)  #返回DataFrame中的最后一行
data.head(1)  #返回DataFrame中的第一行

最近处理数据时发现当pd.read_csv()数据时有时候会有读取到未命名的列,且该列也用不到,一般是索引列被换掉后导致的,有强迫症的看着难受,这时候dataframe.drop([columns,])是没法处理的,怎么办呢,

最笨的方法是直接给列索引重命名:

data6

    Unnamed: 0 high  symbol time
date        
2016-11-01 0  3317.4 IF1611 18:10:44.8
2016-11-01 1  3317.4 IF1611 06:01:04.5
2016-11-01 2  3317.4 IF1611 07:46:25.5
2016-11-01 3  3318.4 IF1611 09:30:04.0
2016-11-01 4  3321.8 IF1611 09:31:04.0

data6.columns = list('abcd')

data6

  a  b  c  d
date        
2016-11-01 0  3317.4 IF1611 18:10:44.8
2016-11-01 1  3317.4 IF1611 06:01:04.5
2016-11-01 2  3317.4 IF1611 07:46:25.5
2016-11-01 3  3318.4 IF1611 09:30:04.0
2016-11-01 4  3321.8 IF1611 09:31:04.0

重新命名后就可以用dataframe.drop([columns])来删除了,当然不用我这样全部给列名替换掉了,可以只是改变未命名的那个列,然后删除。不过这个用起来总是觉得有点low,有没有更好的方法呢,有,可以不去删除,直接:

data7 = data6.ix[:,1:]1

这样既不改变原有数据,也达到了删除神烦列,当然我这里时第0列删除,可以根据实际选择所在的列删除之,至于这个原理,可以看下前面的对列的操作。

github地址

到此这篇关于python中pandas库中DataFrame对行和列的操作使用方法示例的文章就介绍到这了,更多相关pandas库DataFrame行列操作内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
python 合并文件的具体实例
Aug 08 Python
使用SAE部署Python运行环境的教程
May 05 Python
Python实现数通设备端口使用情况监控实例
Jul 15 Python
Python中的sort()方法使用基础教程
Jan 08 Python
在Python的一段程序中如何使用多次事件循环详解
Sep 07 Python
批量将ppt转换为pdf的Python代码 只要27行!
Feb 26 Python
解决Python2.7中IDLE启动没有反应的问题
Nov 30 Python
django 基于中间件实现限制ip频繁访问过程详解
Jul 30 Python
python面向对象 反射原理解析
Aug 12 Python
python继承threading.Thread实现有返回值的子类实例
May 02 Python
基于pytorch中的Sequential用法说明
Jun 24 Python
python中的getter与setter你了解吗
Mar 24 Python
Django 构建模板form表单的两种方法
Jun 14 #Python
Python Django搭建网站流程图解
Jun 13 #Python
Python xpath表达式如何实现数据处理
Jun 13 #Python
Python轻量级web框架bottle使用方法解析
Jun 13 #Python
PyInstaller运行原理及常用操作详解
Jun 13 #Python
Pandas缺失值2种处理方式代码实例
Jun 13 #Python
Python Django中间件使用原理及流程分析
Jun 13 #Python
You might like
ThinkPHP框架中使用Memcached缓存数据的方法
2018/03/31 PHP
PHP面向对象程序设计继承用法简单示例
2018/12/28 PHP
laravel框架中间件 except 和 only 的用法示例
2019/07/12 PHP
Javascript 刷新全集常用代码
2009/11/22 Javascript
JavaScript Memoization 让函数也有记忆功能
2011/10/27 Javascript
动态的改变IFrame的高度实现IFrame自动伸展适应高度
2012/12/28 Javascript
在javascript中创建对象的各种模式解析
2016/05/16 Javascript
AngularJS 过滤器(自带和自建)详解
2016/09/19 Javascript
jquery实现下拉框多选方法介绍
2017/01/03 Javascript
addEventListener()与removeEventListener()解析
2017/04/20 Javascript
JavaScript键盘事件常见用法实例分析
2019/01/03 Javascript
vue+elementUi 实现密码显示/隐藏+小图标变化功能
2020/01/18 Javascript
从零开始在vue-cli4配置自适应vw布局的实现
2020/06/08 Javascript
vue实现前端列表多条件筛选
2020/10/26 Javascript
python模拟登陆阿里妈妈生成商品推广链接
2014/04/03 Python
Python调用C/C++动态链接库的方法详解
2014/07/22 Python
python进行两个表格对比的方法
2018/06/27 Python
详解Python3中setuptools、Pip安装教程
2019/06/18 Python
Python 网络编程之TCP客户端/服务端功能示例【基于socket套接字】
2019/10/12 Python
使用python 对验证码图片进行降噪处理
2019/12/18 Python
英国领先的体验日提供商:Buyagift
2019/04/19 全球购物
局部内部类是否可以访问非final变量?
2013/04/20 面试题
StringBuilder和String的区别
2015/05/18 面试题
货代行业个人求职简历的自我评价
2013/10/22 职场文书
预备党员党校学习自我评价分享
2013/11/12 职场文书
优秀党员主要事迹
2014/01/19 职场文书
经典演讲稿汇总
2014/05/19 职场文书
抵押贷款承诺书
2014/05/30 职场文书
小学标准化建设汇报材料
2014/08/16 职场文书
社区文艺活动方案
2014/08/19 职场文书
2014年纳税评估工作总结
2014/12/23 职场文书
2015年教师自我评价范文
2015/03/04 职场文书
单位收入证明范本
2015/06/18 职场文书
格列夫游记读书笔记
2015/07/01 职场文书
Filebeat 采集 Nginx 日志的方法
2021/03/31 Servers
试用1103暨1103、1101同门大比武 [ DAIWEI ]
2022/04/05 无线电