利用pandas读取中文数据集的方法


Posted in Python onJuly 25, 2018

直接利用numpy读取非数字型的数据集时需要先进行转换,而且python3在处理中文数据方面确实比较蛋疼。最近在学习周志华老师的那本西瓜书,需要没事和一堆西瓜反复较劲,之前进行联系的时候都是利用批量替换先清理一遍数据,不过这样实在是太麻烦了,今天偶然发现可以使用pandas来实现读取中文数据集的功能。

首先分享一下数据集:

编号,色泽,根蒂,敲声,纹理,脐部,触感,密度,含糖率,好瓜 
1,青绿,蜷缩,浊响,清晰,凹陷,硬滑,0.697,0.46,是 
2,乌黑,蜷缩,沉闷,清晰,凹陷,硬滑,0.774,0.376,是 
3,乌黑,蜷缩,浊响,清晰,凹陷,硬滑,0.634,0.264,是 
4,青绿,蜷缩,沉闷,清晰,凹陷,硬滑,0.608,0.318,是 
5,浅白,蜷缩,浊响,清晰,凹陷,硬滑,0.556,0.215,是 
6,青绿,稍蜷,浊响,清晰,稍凹,软粘,0.403,0.237,是 
7,乌黑,稍蜷,浊响,稍糊,稍凹,软粘,0.481,0.149,是 
8,乌黑,稍蜷,浊响,清晰,稍凹,硬滑,0.437,0.211,是 
9,乌黑,稍蜷,沉闷,稍糊,稍凹,硬滑,0.666,0.091,否 
10,青绿,硬挺,清脆,清晰,平坦,软粘,0.243,0.267,否 
11,浅白,硬挺,清脆,模糊,平坦,硬滑,0.245,0.057,否 
12,浅白,蜷缩,浊响,模糊,平坦,软粘,0.343,0.099,否 
13,青绿,稍蜷,浊响,稍糊,凹陷,硬滑,0.639,0.161,否 
14,浅白,稍蜷,沉闷,稍糊,凹陷,硬滑,0.657,0.198,否 
15,乌黑,稍蜷,浊响,清晰,稍凹,软粘,0.36,0.37,否 
16,浅白,蜷缩,浊响,模糊,平坦,硬滑,0.593,0.042,否 
17,青绿,蜷缩,沉闷,稍糊,稍凹,硬滑,0.719,0.103,否

然后利用pandas将它读进来:

import pandas
d = pandas.read_csv(r"d:\data.csv",sep=",")
print(d)

利用pandas读取中文数据集的方法

如果要选取某一行数据,可以使用head方法:

d.head(1)

其中参数是行号。

也可以直接取某一列,如:

d['色泽']

如果要取某一个数据则可以将两种方法结合使用:

d.head(1)['色泽']

以上这篇利用pandas读取中文数据集的方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python实现的文件夹清理程序分享
Nov 22 Python
python实现简单购物商城
May 21 Python
python基本语法练习实例
Sep 19 Python
Python探索之ModelForm代码详解
Oct 26 Python
Python3.6.x中内置函数总结及讲解
Feb 22 Python
浅谈python 中类属性共享的问题
Jul 02 Python
pytorch 使用加载训练好的模型做inference
Feb 20 Python
python实现简单学生信息管理系统
Apr 09 Python
python如何保存文本文件
Jun 07 Python
python安装cx_Oracle和wxPython的方法
Sep 14 Python
Python利用matplotlib绘制散点图的新手教程
Nov 05 Python
python基于selenium爬取斗鱼弹幕
Feb 20 Python
利用pandas进行大文件计数处理的方法
Jul 25 #Python
使用python验证代理ip是否可用的实现方法
Jul 25 #Python
Python+Pandas 获取数据库并加入DataFrame的实例
Jul 25 #Python
python requests 测试代理ip是否生效
Jul 25 #Python
Python使用pymysql从MySQL数据库中读出数据的方法
Jul 25 #Python
Python统计python文件中代码,注释及空白对应的行数示例【测试可用】
Jul 25 #Python
Pandas读取MySQL数据到DataFrame的方法
Jul 25 #Python
You might like
PHP静态新闻列表自动生成代码
2007/06/14 PHP
适用于php-5.2 的 php.ini 中文版[金步国翻译]
2011/04/17 PHP
基于Discuz security.inc.php代码的深入分析
2013/06/03 PHP
php调用nginx的mod_zip模块打包ZIP文件
2014/06/11 PHP
php中__destruct与register_shutdown_function执行的先后顺序问题
2014/10/17 PHP
ThinkPHP 框架实现的读取excel导入数据库操作示例
2020/04/14 PHP
静态图片的十一种滤镜效果--不支持Ie7及非IE浏览器。
2007/03/06 Javascript
Javascript alert消息换行的方法
2013/08/07 Javascript
下拉列表select 由左边框移动到右边示例
2013/12/04 Javascript
jQuery中:file选择器用法实例
2015/01/04 Javascript
jQuery中dom元素上绑定的事件详解
2015/04/24 Javascript
JavaScript中Function()函数的使用教程
2015/06/04 Javascript
JavaScript中String.match()方法的使用详解
2015/06/06 Javascript
jquery中val()方法是从最后一个选项往前读取的
2015/09/06 Javascript
jQuery中hover方法搭配css的hover选择器,实现选中元素突出显示方法
2017/05/08 jQuery
WebSocket实现简单客服聊天系统
2017/05/12 Javascript
jQuery实现选中行变色效果(实例讲解)
2017/07/06 jQuery
浅谈vue的iview列表table render函数设置DOM属性值的方法
2017/09/30 Javascript
JavaScript实现点击出现图片并统计点击次数功能示例
2018/07/23 Javascript
angular2 组件之间通过service互相传递的实例
2018/09/30 Javascript
Openlayers绘制地图标注
2020/09/28 Javascript
详解Python中的各种函数的使用
2015/05/24 Python
使用python turtle画高达
2020/01/19 Python
python-docx文件定位读取过程(尝试替换)
2020/02/13 Python
查看jupyter notebook每个单元格运行时间实例
2020/04/22 Python
详解python实现可视化的MD5、sha256哈希加密小工具
2020/09/14 Python
html5 拖拽上传图片实例演示
2013/04/01 HTML / CSS
请用Java实现列出某个目录下的所有文件
2013/09/23 面试题
中医专业应届生求职信
2013/11/17 职场文书
三年大学自我鉴定
2014/01/16 职场文书
人力资源主管岗位职责
2014/01/29 职场文书
道德演讲稿
2014/05/21 职场文书
煤矿安全知识竞赛活动总结
2014/07/07 职场文书
干部作风整顿自我剖析材料和整改措施
2014/09/18 职场文书
邹越演讲观后感
2015/06/15 职场文书
Jupyter Notebook 如何修改字体和大小以及更改字体样式
2021/06/03 Python