利用pandas读取中文数据集的方法


Posted in Python onJuly 25, 2018

直接利用numpy读取非数字型的数据集时需要先进行转换,而且python3在处理中文数据方面确实比较蛋疼。最近在学习周志华老师的那本西瓜书,需要没事和一堆西瓜反复较劲,之前进行联系的时候都是利用批量替换先清理一遍数据,不过这样实在是太麻烦了,今天偶然发现可以使用pandas来实现读取中文数据集的功能。

首先分享一下数据集:

编号,色泽,根蒂,敲声,纹理,脐部,触感,密度,含糖率,好瓜 
1,青绿,蜷缩,浊响,清晰,凹陷,硬滑,0.697,0.46,是 
2,乌黑,蜷缩,沉闷,清晰,凹陷,硬滑,0.774,0.376,是 
3,乌黑,蜷缩,浊响,清晰,凹陷,硬滑,0.634,0.264,是 
4,青绿,蜷缩,沉闷,清晰,凹陷,硬滑,0.608,0.318,是 
5,浅白,蜷缩,浊响,清晰,凹陷,硬滑,0.556,0.215,是 
6,青绿,稍蜷,浊响,清晰,稍凹,软粘,0.403,0.237,是 
7,乌黑,稍蜷,浊响,稍糊,稍凹,软粘,0.481,0.149,是 
8,乌黑,稍蜷,浊响,清晰,稍凹,硬滑,0.437,0.211,是 
9,乌黑,稍蜷,沉闷,稍糊,稍凹,硬滑,0.666,0.091,否 
10,青绿,硬挺,清脆,清晰,平坦,软粘,0.243,0.267,否 
11,浅白,硬挺,清脆,模糊,平坦,硬滑,0.245,0.057,否 
12,浅白,蜷缩,浊响,模糊,平坦,软粘,0.343,0.099,否 
13,青绿,稍蜷,浊响,稍糊,凹陷,硬滑,0.639,0.161,否 
14,浅白,稍蜷,沉闷,稍糊,凹陷,硬滑,0.657,0.198,否 
15,乌黑,稍蜷,浊响,清晰,稍凹,软粘,0.36,0.37,否 
16,浅白,蜷缩,浊响,模糊,平坦,硬滑,0.593,0.042,否 
17,青绿,蜷缩,沉闷,稍糊,稍凹,硬滑,0.719,0.103,否

然后利用pandas将它读进来:

import pandas
d = pandas.read_csv(r"d:\data.csv",sep=",")
print(d)

利用pandas读取中文数据集的方法

如果要选取某一行数据,可以使用head方法:

d.head(1)

其中参数是行号。

也可以直接取某一列,如:

d['色泽']

如果要取某一个数据则可以将两种方法结合使用:

d.head(1)['色泽']

以上这篇利用pandas读取中文数据集的方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python执行子进程实现进程间通信的方法
Jun 02 Python
python中函数传参详解
Jul 03 Python
Python中字符串的处理技巧分享
Sep 17 Python
Django使用Celery异步任务队列的使用
Mar 13 Python
Python3 安装PyQt5及exe打包图文教程
Jan 08 Python
Django csrf 两种方法设置form的实例
Feb 03 Python
python使用MQTT给硬件传输图片的实现方法
May 05 Python
Python&&GDAL实现NDVI的计算方式
Jan 09 Python
IDLE下Python文件编辑和运行操作
Apr 25 Python
如何将PySpark导入Python的放实现(2种)
Apr 26 Python
python怎么删除缓存文件
Jul 19 Python
Python使用OpenCV和K-Means聚类对毕业照进行图像分割
Jun 11 Python
利用pandas进行大文件计数处理的方法
Jul 25 #Python
使用python验证代理ip是否可用的实现方法
Jul 25 #Python
Python+Pandas 获取数据库并加入DataFrame的实例
Jul 25 #Python
python requests 测试代理ip是否生效
Jul 25 #Python
Python使用pymysql从MySQL数据库中读出数据的方法
Jul 25 #Python
Python统计python文件中代码,注释及空白对应的行数示例【测试可用】
Jul 25 #Python
Pandas读取MySQL数据到DataFrame的方法
Jul 25 #Python
You might like
PHP 时间转换Unix时间戳代码
2010/01/22 PHP
PHP APC的安装与使用详解
2013/06/13 PHP
PHP下用Swoole实现Actor并发模型的方法
2019/06/12 PHP
超级退弹代码
2008/07/07 Javascript
另一个javascript小测验(代码集合)
2011/07/27 Javascript
回车直接实现点击某按钮的效果即触发单击事件
2014/02/27 Javascript
JS+CSS实现感应鼠标渐变显示DIV层的方法
2015/02/20 Javascript
jQuery判断浏览器并动态调整select宽度的方法
2016/03/02 Javascript
jQuery实现的兼容性浮动层示例
2016/08/02 Javascript
使用JS实现图片展示瀑布流效果的实例代码
2016/09/12 Javascript
原生JS实现在线问卷调查投票特效
2017/01/03 Javascript
AngularJS使用拦截器实现的loading功能完整实例
2017/05/17 Javascript
简单实现js放大镜效果
2017/07/24 Javascript
Vue请求java服务端并返回数据代码实例
2019/11/28 Javascript
ant-design-vue 实现表格内部字段验证功能
2019/12/16 Javascript
用Python的Tornado框架结合memcached页面改善博客性能
2015/04/24 Python
python获得文件创建时间和修改时间的方法
2015/06/30 Python
对pandas读取中文unicode的csv和添加行标题的方法详解
2018/12/12 Python
对python借助百度云API对评论进行观点抽取的方法详解
2019/02/21 Python
python频繁写入文件时提速的方法
2019/06/26 Python
Python自动化导出zabbix数据并发邮件脚本
2019/08/16 Python
python实现监控阿里云账户余额功能
2019/12/16 Python
Pytorch中.new()的作用详解
2020/02/18 Python
OpenCV图片漫画效果的实现示例
2020/08/18 Python
德国团购网站:Groupon德国
2018/03/13 全球购物
意大利奢侈品综合电商网站:MODES
2019/12/14 全球购物
物流专业大学应届生求职信
2013/11/03 职场文书
校园文化建设方案
2014/02/03 职场文书
机关单位人员学雷锋心得体会
2014/03/10 职场文书
《第一次抱母亲》教学反思
2014/04/16 职场文书
2014年优质护理服务工作总结
2014/11/14 职场文书
借条如何写
2015/05/26 职场文书
《颐和园》教学反思
2016/02/19 职场文书
Python Django项目和应用的创建详解
2021/11/27 Python
清空 Oracle 安装记录并重新安装
2022/04/26 Oracle
详解Spring Bean的配置方式与实例化
2022/06/10 Java/Android