利用pandas读取中文数据集的方法


Posted in Python onJuly 25, 2018

直接利用numpy读取非数字型的数据集时需要先进行转换,而且python3在处理中文数据方面确实比较蛋疼。最近在学习周志华老师的那本西瓜书,需要没事和一堆西瓜反复较劲,之前进行联系的时候都是利用批量替换先清理一遍数据,不过这样实在是太麻烦了,今天偶然发现可以使用pandas来实现读取中文数据集的功能。

首先分享一下数据集:

编号,色泽,根蒂,敲声,纹理,脐部,触感,密度,含糖率,好瓜 
1,青绿,蜷缩,浊响,清晰,凹陷,硬滑,0.697,0.46,是 
2,乌黑,蜷缩,沉闷,清晰,凹陷,硬滑,0.774,0.376,是 
3,乌黑,蜷缩,浊响,清晰,凹陷,硬滑,0.634,0.264,是 
4,青绿,蜷缩,沉闷,清晰,凹陷,硬滑,0.608,0.318,是 
5,浅白,蜷缩,浊响,清晰,凹陷,硬滑,0.556,0.215,是 
6,青绿,稍蜷,浊响,清晰,稍凹,软粘,0.403,0.237,是 
7,乌黑,稍蜷,浊响,稍糊,稍凹,软粘,0.481,0.149,是 
8,乌黑,稍蜷,浊响,清晰,稍凹,硬滑,0.437,0.211,是 
9,乌黑,稍蜷,沉闷,稍糊,稍凹,硬滑,0.666,0.091,否 
10,青绿,硬挺,清脆,清晰,平坦,软粘,0.243,0.267,否 
11,浅白,硬挺,清脆,模糊,平坦,硬滑,0.245,0.057,否 
12,浅白,蜷缩,浊响,模糊,平坦,软粘,0.343,0.099,否 
13,青绿,稍蜷,浊响,稍糊,凹陷,硬滑,0.639,0.161,否 
14,浅白,稍蜷,沉闷,稍糊,凹陷,硬滑,0.657,0.198,否 
15,乌黑,稍蜷,浊响,清晰,稍凹,软粘,0.36,0.37,否 
16,浅白,蜷缩,浊响,模糊,平坦,硬滑,0.593,0.042,否 
17,青绿,蜷缩,沉闷,稍糊,稍凹,硬滑,0.719,0.103,否

然后利用pandas将它读进来:

import pandas
d = pandas.read_csv(r"d:\data.csv",sep=",")
print(d)

利用pandas读取中文数据集的方法

如果要选取某一行数据,可以使用head方法:

d.head(1)

其中参数是行号。

也可以直接取某一列,如:

d['色泽']

如果要取某一个数据则可以将两种方法结合使用:

d.head(1)['色泽']

以上这篇利用pandas读取中文数据集的方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python网络编程之UDP通信实例(含服务器端、客户端、UDP广播例子)
Apr 25 Python
Python实现从百度API获取天气的方法
Mar 11 Python
python 连接各类主流数据库的实例代码
Jan 30 Python
使用Python实现微信提醒备忘录功能
Dec 04 Python
Python函数装饰器实现方法详解
Dec 22 Python
ubuntu 16.04下python版本切换的方法
Jun 14 Python
PIL图像处理模块paste方法简单使用详解
Jul 17 Python
10分钟教你用python动画演示深度优先算法搜寻逃出迷宫的路径
Aug 12 Python
python实现猜数字游戏
Mar 25 Python
TensorFlow学习之分布式的TensorFlow运行环境
Feb 05 Python
Python实现鼠标自动在屏幕上随机移动功能
Mar 14 Python
Python 爬虫的原理
Jul 30 Python
利用pandas进行大文件计数处理的方法
Jul 25 #Python
使用python验证代理ip是否可用的实现方法
Jul 25 #Python
Python+Pandas 获取数据库并加入DataFrame的实例
Jul 25 #Python
python requests 测试代理ip是否生效
Jul 25 #Python
Python使用pymysql从MySQL数据库中读出数据的方法
Jul 25 #Python
Python统计python文件中代码,注释及空白对应的行数示例【测试可用】
Jul 25 #Python
Pandas读取MySQL数据到DataFrame的方法
Jul 25 #Python
You might like
php如何调用webservice应用介绍
2012/11/24 PHP
php实现查看邮件是否已被阅读的方法
2013/12/03 PHP
在win7中搭建Linux+PHP 开发环境
2014/10/08 PHP
验证用户是否修改过页面的数据的实现方法
2008/09/26 Javascript
js 自定义的联动下拉框
2010/02/07 Javascript
jquery的extend和fn.extend的使用说明
2011/01/09 Javascript
js常用代码段收集
2011/10/28 Javascript
在jQuery ajax中按钮button和submit的区别分析
2012/10/07 Javascript
对于this和$(this)的个人理解
2013/09/08 Javascript
动态添加删除表格行的js实现代码
2014/02/28 Javascript
JavaScript中的prototype.bind()方法介绍
2014/04/04 Javascript
IE6 hack for js 集锦
2014/09/23 Javascript
node.js中的console.error方法使用说明
2014/12/10 Javascript
JavaScript中的this关键字使用详解
2015/08/14 Javascript
轻松实现javascript图片轮播特效
2016/01/13 Javascript
浅谈JQ中mouseover和mouseenter的区别
2016/09/13 Javascript
KVM虚拟化技术之使用Qemu-kvm创建和管理虚拟机的方法
2016/10/05 Javascript
JS匿名函数类生成方式实例分析
2016/11/26 Javascript
js拖拽功能实现代码解析
2016/11/28 Javascript
js eval函数使用,js对象和字符串互转实例
2017/03/06 Javascript
详解nodeJS之二进制buffer对象
2017/06/03 NodeJs
微信小程序之发送短信倒计时功能
2017/08/30 Javascript
使用vue重构资讯页面的实例代码解析
2019/11/26 Javascript
Python中的MongoDB基本操作:连接、查询实例
2015/02/13 Python
Python检测网站链接是否已存在
2016/04/07 Python
Python实战小程序利用matplotlib模块画图代码分享
2017/12/09 Python
python 显示数组全部元素的方法
2018/04/19 Python
Python设计模式之组合模式原理与用法实例分析
2019/01/11 Python
基于python实现的百度音乐下载器python pyqt改进版(附代码)
2019/08/05 Python
Django发送邮件和itsdangerous模块的配合使用解析
2019/08/10 Python
Pycharm中如何关掉python console
2020/10/27 Python
受希腊女神灵感的晚礼服、鸡尾酒礼服和婚纱:THEIA
2018/04/15 全球购物
建筑公司员工自我鉴定
2014/04/08 职场文书
承兑汇票延期证明
2015/06/23 职场文书
js实现自动锁屏功能
2021/06/02 Javascript
hive数据仓库新增字段方法
2022/06/25 数据库