利用pandas读取中文数据集的方法


Posted in Python onJuly 25, 2018

直接利用numpy读取非数字型的数据集时需要先进行转换,而且python3在处理中文数据方面确实比较蛋疼。最近在学习周志华老师的那本西瓜书,需要没事和一堆西瓜反复较劲,之前进行联系的时候都是利用批量替换先清理一遍数据,不过这样实在是太麻烦了,今天偶然发现可以使用pandas来实现读取中文数据集的功能。

首先分享一下数据集:

编号,色泽,根蒂,敲声,纹理,脐部,触感,密度,含糖率,好瓜 
1,青绿,蜷缩,浊响,清晰,凹陷,硬滑,0.697,0.46,是 
2,乌黑,蜷缩,沉闷,清晰,凹陷,硬滑,0.774,0.376,是 
3,乌黑,蜷缩,浊响,清晰,凹陷,硬滑,0.634,0.264,是 
4,青绿,蜷缩,沉闷,清晰,凹陷,硬滑,0.608,0.318,是 
5,浅白,蜷缩,浊响,清晰,凹陷,硬滑,0.556,0.215,是 
6,青绿,稍蜷,浊响,清晰,稍凹,软粘,0.403,0.237,是 
7,乌黑,稍蜷,浊响,稍糊,稍凹,软粘,0.481,0.149,是 
8,乌黑,稍蜷,浊响,清晰,稍凹,硬滑,0.437,0.211,是 
9,乌黑,稍蜷,沉闷,稍糊,稍凹,硬滑,0.666,0.091,否 
10,青绿,硬挺,清脆,清晰,平坦,软粘,0.243,0.267,否 
11,浅白,硬挺,清脆,模糊,平坦,硬滑,0.245,0.057,否 
12,浅白,蜷缩,浊响,模糊,平坦,软粘,0.343,0.099,否 
13,青绿,稍蜷,浊响,稍糊,凹陷,硬滑,0.639,0.161,否 
14,浅白,稍蜷,沉闷,稍糊,凹陷,硬滑,0.657,0.198,否 
15,乌黑,稍蜷,浊响,清晰,稍凹,软粘,0.36,0.37,否 
16,浅白,蜷缩,浊响,模糊,平坦,硬滑,0.593,0.042,否 
17,青绿,蜷缩,沉闷,稍糊,稍凹,硬滑,0.719,0.103,否

然后利用pandas将它读进来:

import pandas
d = pandas.read_csv(r"d:\data.csv",sep=",")
print(d)

利用pandas读取中文数据集的方法

如果要选取某一行数据,可以使用head方法:

d.head(1)

其中参数是行号。

也可以直接取某一列,如:

d['色泽']

如果要取某一个数据则可以将两种方法结合使用:

d.head(1)['色泽']

以上这篇利用pandas读取中文数据集的方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python通过BF算法实现关键词匹配的方法
Mar 13 Python
在Python中使用HTMLParser解析HTML的教程
Apr 29 Python
Python中的FTP通信模块ftplib的用法整理
Jul 08 Python
python+pyqt实现右下角弹出框
Oct 26 Python
简单谈谈python中的lambda表达式
Jan 19 Python
python实现txt文件格式转换为arff格式
May 31 Python
python操作excel的包(openpyxl、xlsxwriter)
Jun 11 Python
Python configparser模块常用方法解析
May 22 Python
keras 回调函数Callbacks 断点ModelCheckpoint教程
Jun 18 Python
Python爬虫抓取指定网页图片代码实例
Jul 24 Python
基于Python爬取搜狐证券股票过程解析
Nov 18 Python
Python环境搭建过程从安装到Hello World
Feb 05 Python
利用pandas进行大文件计数处理的方法
Jul 25 #Python
使用python验证代理ip是否可用的实现方法
Jul 25 #Python
Python+Pandas 获取数据库并加入DataFrame的实例
Jul 25 #Python
python requests 测试代理ip是否生效
Jul 25 #Python
Python使用pymysql从MySQL数据库中读出数据的方法
Jul 25 #Python
Python统计python文件中代码,注释及空白对应的行数示例【测试可用】
Jul 25 #Python
Pandas读取MySQL数据到DataFrame的方法
Jul 25 #Python
You might like
PHP基于imap获取邮件实例
2014/11/11 PHP
Yii框架获取当前controlle和action对应id的方法
2014/12/03 PHP
php显示指定目录下子目录的方法
2015/03/20 PHP
PHP convert_uudecode()函数讲解
2019/02/14 PHP
PHP防止sql注入小技巧之sql预处理原理与实现方法分析
2019/12/13 PHP
extJs 常用到的增,删,改,查操作代码
2009/12/28 Javascript
基于jQuery的计算文本框字数的代码
2012/06/06 Javascript
对于this和$(this)的个人理解
2013/09/08 Javascript
JSON传递bool类型数据的处理方式介绍
2013/09/18 Javascript
在JS中如何调用JSP中的变量
2014/01/22 Javascript
关于页面嵌入swf覆盖div层的问题的解决方法
2014/02/11 Javascript
Bootstrap组件学习之导航、标签、面包屑导航(精品)
2016/05/17 Javascript
JS实现的简单轮播图运动效果示例
2016/12/22 Javascript
Vue.js与 ASP.NET Core 服务端渲染功能整合
2017/11/16 Javascript
ES6如何用一句代码实现函数的柯里化
2020/01/18 Javascript
Vue的Eslint配置文件eslintrc.js说明与规则介绍
2020/02/03 Javascript
关于vue3默认把所有onSomething当作v-on事件绑定的思考
2020/05/15 Javascript
[11:27]《一刀刀一天》之DOTA全时刻20:TI4总奖金突破920W TS赛事分析
2014/06/18 DOTA
解决Python字典写入文件出行首行有空格的问题
2017/09/27 Python
Django自定义用户认证示例详解
2018/03/14 Python
Python使用while循环花式打印乘法表
2019/01/28 Python
python3中property使用方法详解
2019/04/23 Python
python连接PostgreSQL过程解析
2020/02/09 Python
Django模板标签中url使用详解(url跳转到指定页面)
2020/03/19 Python
Python %r和%s区别代码实例解析
2020/04/03 Python
python模拟点击在ios中实现的实例讲解
2020/11/26 Python
python中time、datetime模块的使用
2020/12/14 Python
美国Max仓库:Max Warehouse
2020/05/31 全球购物
双立人加拿大官网:Zwilling加拿大
2020/08/10 全球购物
电脑销售顾问自荐信
2014/01/29 职场文书
消防安全管理制度
2014/02/01 职场文书
致200米运动员广播稿
2014/02/06 职场文书
初婚未育证明样本
2014/10/24 职场文书
2014年商场工作总结
2014/11/22 职场文书
Javascript中async与await的捕捉错误详解
2022/03/03 Javascript
vue二维数组循环嵌套方式 循环数组、循环嵌套数组
2022/04/24 Vue.js