利用pandas读取中文数据集的方法


Posted in Python onJuly 25, 2018

直接利用numpy读取非数字型的数据集时需要先进行转换,而且python3在处理中文数据方面确实比较蛋疼。最近在学习周志华老师的那本西瓜书,需要没事和一堆西瓜反复较劲,之前进行联系的时候都是利用批量替换先清理一遍数据,不过这样实在是太麻烦了,今天偶然发现可以使用pandas来实现读取中文数据集的功能。

首先分享一下数据集:

编号,色泽,根蒂,敲声,纹理,脐部,触感,密度,含糖率,好瓜 
1,青绿,蜷缩,浊响,清晰,凹陷,硬滑,0.697,0.46,是 
2,乌黑,蜷缩,沉闷,清晰,凹陷,硬滑,0.774,0.376,是 
3,乌黑,蜷缩,浊响,清晰,凹陷,硬滑,0.634,0.264,是 
4,青绿,蜷缩,沉闷,清晰,凹陷,硬滑,0.608,0.318,是 
5,浅白,蜷缩,浊响,清晰,凹陷,硬滑,0.556,0.215,是 
6,青绿,稍蜷,浊响,清晰,稍凹,软粘,0.403,0.237,是 
7,乌黑,稍蜷,浊响,稍糊,稍凹,软粘,0.481,0.149,是 
8,乌黑,稍蜷,浊响,清晰,稍凹,硬滑,0.437,0.211,是 
9,乌黑,稍蜷,沉闷,稍糊,稍凹,硬滑,0.666,0.091,否 
10,青绿,硬挺,清脆,清晰,平坦,软粘,0.243,0.267,否 
11,浅白,硬挺,清脆,模糊,平坦,硬滑,0.245,0.057,否 
12,浅白,蜷缩,浊响,模糊,平坦,软粘,0.343,0.099,否 
13,青绿,稍蜷,浊响,稍糊,凹陷,硬滑,0.639,0.161,否 
14,浅白,稍蜷,沉闷,稍糊,凹陷,硬滑,0.657,0.198,否 
15,乌黑,稍蜷,浊响,清晰,稍凹,软粘,0.36,0.37,否 
16,浅白,蜷缩,浊响,模糊,平坦,硬滑,0.593,0.042,否 
17,青绿,蜷缩,沉闷,稍糊,稍凹,硬滑,0.719,0.103,否

然后利用pandas将它读进来:

import pandas
d = pandas.read_csv(r"d:\data.csv",sep=",")
print(d)

利用pandas读取中文数据集的方法

如果要选取某一行数据,可以使用head方法:

d.head(1)

其中参数是行号。

也可以直接取某一列,如:

d['色泽']

如果要取某一个数据则可以将两种方法结合使用:

d.head(1)['色泽']

以上这篇利用pandas读取中文数据集的方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python实现备份目录的方法
Aug 03 Python
Python每天必学之bytes字节
Jan 28 Python
全面了解python字符串和字典
Jul 07 Python
python并发编程之多进程、多线程、异步和协程详解
Oct 28 Python
python基础教程项目四之新闻聚合
Apr 02 Python
python实现弹窗祝福效果
Apr 07 Python
对python中GUI,Label和Button的实例详解
Jun 27 Python
Django 路由控制的实现
Jul 17 Python
keras.layer.input()用法说明
Jun 16 Python
如何解决安装python3.6.1失败
Jul 01 Python
python IP地址转整数
Nov 20 Python
python学习之panda数据分析核心支持库
May 07 Python
利用pandas进行大文件计数处理的方法
Jul 25 #Python
使用python验证代理ip是否可用的实现方法
Jul 25 #Python
Python+Pandas 获取数据库并加入DataFrame的实例
Jul 25 #Python
python requests 测试代理ip是否生效
Jul 25 #Python
Python使用pymysql从MySQL数据库中读出数据的方法
Jul 25 #Python
Python统计python文件中代码,注释及空白对应的行数示例【测试可用】
Jul 25 #Python
Pandas读取MySQL数据到DataFrame的方法
Jul 25 #Python
You might like
一个PHP操作Access类(PHP+ODBC+Access)
2007/01/02 PHP
PHP开发需要注意的安全问题
2010/09/01 PHP
PHP操作MongoDB时的整数问题及对策说明
2011/05/02 PHP
Laravel 5框架学习之Eloquent (laravel 的ORM)
2015/04/08 PHP
FleaPHP框架数据库查询条件($conditions)写法总结
2016/03/19 PHP
php调用自己java程序的方法详解
2016/05/13 PHP
php 多继承的几种常见实现方法示例
2019/11/18 PHP
Ext对基本类型的扩展 ext,extjs,format
2010/12/25 Javascript
JS中判断null、undefined与NaN的方法
2014/03/24 Javascript
编写高性能Javascript代码的N条建议
2015/10/12 Javascript
jQuery mobile 移动web(6)
2015/12/20 Javascript
实例剖析AngularJS框架中数据的双向绑定运用
2016/03/04 Javascript
VUEJS实战之修复错误并且美化时间(2)
2016/06/13 Javascript
浅谈json取值(对象和数组)
2016/06/24 Javascript
轮播的简单实现方法
2016/07/28 Javascript
JavaScript数组去重由慢到快由繁到简(优化篇)
2016/08/26 Javascript
JQueryEasyUI之DataGrid数据显示
2016/11/23 Javascript
js原生实现移动端手指滑动轮播图效果的示例
2018/01/02 Javascript
js中DOM事件绑定分析
2018/03/18 Javascript
详解如何在nuxt中添加proxyTable代理
2018/08/10 Javascript
ES6箭头函数和扩展实例分析
2020/05/23 Javascript
[01:20:30]OG vs LGD 2018国际邀请赛淘汰赛BO3 第四场 8.26
2018/08/30 DOTA
Python多线程和队列操作实例
2015/06/21 Python
python smtplib模块自动收发邮件功能(一)
2018/05/22 Python
Python如何实现在字符串里嵌入双引号或者单引号
2020/03/02 Python
Keras设定GPU使用内存大小方式(Tensorflow backend)
2020/05/22 Python
Python爬取微信小程序通用方法代码实例详解
2020/09/29 Python
Jeep牧马人、切诺基和自由人零配件:4 Wheel Drive Hardware
2017/07/02 全球购物
Solid & Striped官网:美国泳装品牌
2019/06/19 全球购物
包装类的功能、种类、常用方法
2012/01/27 面试题
.net面试题
2015/12/22 面试题
自荐信要包含哪些内容
2013/11/06 职场文书
文化活动实施方案
2014/03/28 职场文书
2015年会计年终工作总结
2015/05/26 职场文书
单身证明范本
2015/06/15 职场文书
ubuntu如何搭建vsftpd服务器
2022/12/24 Servers