利用pandas读取中文数据集的方法


Posted in Python onJuly 25, 2018

直接利用numpy读取非数字型的数据集时需要先进行转换,而且python3在处理中文数据方面确实比较蛋疼。最近在学习周志华老师的那本西瓜书,需要没事和一堆西瓜反复较劲,之前进行联系的时候都是利用批量替换先清理一遍数据,不过这样实在是太麻烦了,今天偶然发现可以使用pandas来实现读取中文数据集的功能。

首先分享一下数据集:

编号,色泽,根蒂,敲声,纹理,脐部,触感,密度,含糖率,好瓜 
1,青绿,蜷缩,浊响,清晰,凹陷,硬滑,0.697,0.46,是 
2,乌黑,蜷缩,沉闷,清晰,凹陷,硬滑,0.774,0.376,是 
3,乌黑,蜷缩,浊响,清晰,凹陷,硬滑,0.634,0.264,是 
4,青绿,蜷缩,沉闷,清晰,凹陷,硬滑,0.608,0.318,是 
5,浅白,蜷缩,浊响,清晰,凹陷,硬滑,0.556,0.215,是 
6,青绿,稍蜷,浊响,清晰,稍凹,软粘,0.403,0.237,是 
7,乌黑,稍蜷,浊响,稍糊,稍凹,软粘,0.481,0.149,是 
8,乌黑,稍蜷,浊响,清晰,稍凹,硬滑,0.437,0.211,是 
9,乌黑,稍蜷,沉闷,稍糊,稍凹,硬滑,0.666,0.091,否 
10,青绿,硬挺,清脆,清晰,平坦,软粘,0.243,0.267,否 
11,浅白,硬挺,清脆,模糊,平坦,硬滑,0.245,0.057,否 
12,浅白,蜷缩,浊响,模糊,平坦,软粘,0.343,0.099,否 
13,青绿,稍蜷,浊响,稍糊,凹陷,硬滑,0.639,0.161,否 
14,浅白,稍蜷,沉闷,稍糊,凹陷,硬滑,0.657,0.198,否 
15,乌黑,稍蜷,浊响,清晰,稍凹,软粘,0.36,0.37,否 
16,浅白,蜷缩,浊响,模糊,平坦,硬滑,0.593,0.042,否 
17,青绿,蜷缩,沉闷,稍糊,稍凹,硬滑,0.719,0.103,否

然后利用pandas将它读进来:

import pandas
d = pandas.read_csv(r"d:\data.csv",sep=",")
print(d)

利用pandas读取中文数据集的方法

如果要选取某一行数据,可以使用head方法:

d.head(1)

其中参数是行号。

也可以直接取某一列,如:

d['色泽']

如果要取某一个数据则可以将两种方法结合使用:

d.head(1)['色泽']

以上这篇利用pandas读取中文数据集的方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
用python实现批量重命名文件的代码
May 25 Python
Python解析nginx日志文件
May 11 Python
使用url_helper简化Python中Django框架的url配置教程
May 30 Python
Python生成随机数组的方法小结
Apr 15 Python
python输入错误密码用户锁定实现方法
Nov 27 Python
使用numba对Python运算加速的方法
Oct 15 Python
Python小进度条显示代码
Mar 05 Python
python requests使用socks5的例子
Jul 25 Python
python GUI库图形界面开发之PyQt5日期时间控件QDateTimeEdit详细使用方法与实例
Feb 27 Python
python爬虫学习笔记之pyquery模块基本用法详解
Apr 09 Python
SpringBoot首页设置解析(推荐)
Feb 11 Python
Python中的tkinter库简单案例详解
Jan 22 Python
利用pandas进行大文件计数处理的方法
Jul 25 #Python
使用python验证代理ip是否可用的实现方法
Jul 25 #Python
Python+Pandas 获取数据库并加入DataFrame的实例
Jul 25 #Python
python requests 测试代理ip是否生效
Jul 25 #Python
Python使用pymysql从MySQL数据库中读出数据的方法
Jul 25 #Python
Python统计python文件中代码,注释及空白对应的行数示例【测试可用】
Jul 25 #Python
Pandas读取MySQL数据到DataFrame的方法
Jul 25 #Python
You might like
国王的咖啡这么大来头,名字的由来是什么
2021/03/03 咖啡文化
第十二节 类的自动加载 [12]
2006/10/09 PHP
php 前一天或后一天的日期
2008/06/28 PHP
PHP 将图片按创建时间进行分类存储的实现代码
2010/01/05 PHP
php导出word文档与excel电子表格的简单示例代码
2014/03/08 PHP
jquery 插件 任意位置浮动固定层
2008/12/25 Javascript
利用javascript/jquery对上传文件格式过滤的方法
2009/07/25 Javascript
JavaScript Konami Code 实现代码
2009/07/29 Javascript
JavaScript写的一个DIV 弹出网页对话框
2009/08/14 Javascript
javascript实现原生ajax的几种方法介绍
2013/09/21 Javascript
node.js中的http.response.writeHead方法使用说明
2014/12/14 Javascript
js验证真实姓名与身份证号是否匹配
2015/10/13 Javascript
JavaScript原生对象常用方法总结(推荐)
2016/05/13 Javascript
es6系列教程_ Map详解以及常用api介绍
2017/09/25 Javascript
Vue项目添加动态浏览器头部title的方法
2018/07/11 Javascript
jQuery滑动效果实现方法分析
2018/09/05 jQuery
Vue2.0实现组件之间数据交互和通信操作示例
2019/05/16 Javascript
vue指令做滚动加载和监听等
2019/05/26 Javascript
微信h5静默和非静默授权获取用户openId的方法和步骤
2020/06/08 Javascript
Python psutil模块简单使用实例
2015/04/28 Python
详解Django框架中的视图级缓存
2015/07/23 Python
Python 模板引擎的注入问题分析
2017/01/01 Python
python实现发送邮件及附件功能
2021/03/02 Python
python3中函数参数的四种简单用法
2018/07/09 Python
python画图--输出指定像素点的颜色值方法
2019/07/03 Python
Python OpenCV读取中文路径图像的方法
2020/07/02 Python
python与c语言的语法有哪些不一样的
2020/09/13 Python
CSS伪类与CSS伪元素的区别及由来具体说明
2012/12/07 HTML / CSS
css3动画事件—webkitAnimationEnd与计时器time事件
2013/01/31 HTML / CSS
使用phonegap检测网络状态的方法
2017/03/30 HTML / CSS
HTML5本地数据库基础操作详解
2016/04/26 HTML / CSS
Urban Outfitters英国官网:美国平价服饰品牌
2016/11/25 全球购物
父母对孩子的寄语
2014/04/09 职场文书
初中毕业典礼演讲稿
2014/09/09 职场文书
官僚主义现象查摆问题整改措施
2014/10/04 职场文书
Python控制台输出俄罗斯方块的方法实例
2021/04/17 Python