利用pandas读取中文数据集的方法


Posted in Python onJuly 25, 2018

直接利用numpy读取非数字型的数据集时需要先进行转换,而且python3在处理中文数据方面确实比较蛋疼。最近在学习周志华老师的那本西瓜书,需要没事和一堆西瓜反复较劲,之前进行联系的时候都是利用批量替换先清理一遍数据,不过这样实在是太麻烦了,今天偶然发现可以使用pandas来实现读取中文数据集的功能。

首先分享一下数据集:

编号,色泽,根蒂,敲声,纹理,脐部,触感,密度,含糖率,好瓜 
1,青绿,蜷缩,浊响,清晰,凹陷,硬滑,0.697,0.46,是 
2,乌黑,蜷缩,沉闷,清晰,凹陷,硬滑,0.774,0.376,是 
3,乌黑,蜷缩,浊响,清晰,凹陷,硬滑,0.634,0.264,是 
4,青绿,蜷缩,沉闷,清晰,凹陷,硬滑,0.608,0.318,是 
5,浅白,蜷缩,浊响,清晰,凹陷,硬滑,0.556,0.215,是 
6,青绿,稍蜷,浊响,清晰,稍凹,软粘,0.403,0.237,是 
7,乌黑,稍蜷,浊响,稍糊,稍凹,软粘,0.481,0.149,是 
8,乌黑,稍蜷,浊响,清晰,稍凹,硬滑,0.437,0.211,是 
9,乌黑,稍蜷,沉闷,稍糊,稍凹,硬滑,0.666,0.091,否 
10,青绿,硬挺,清脆,清晰,平坦,软粘,0.243,0.267,否 
11,浅白,硬挺,清脆,模糊,平坦,硬滑,0.245,0.057,否 
12,浅白,蜷缩,浊响,模糊,平坦,软粘,0.343,0.099,否 
13,青绿,稍蜷,浊响,稍糊,凹陷,硬滑,0.639,0.161,否 
14,浅白,稍蜷,沉闷,稍糊,凹陷,硬滑,0.657,0.198,否 
15,乌黑,稍蜷,浊响,清晰,稍凹,软粘,0.36,0.37,否 
16,浅白,蜷缩,浊响,模糊,平坦,硬滑,0.593,0.042,否 
17,青绿,蜷缩,沉闷,稍糊,稍凹,硬滑,0.719,0.103,否

然后利用pandas将它读进来:

import pandas
d = pandas.read_csv(r"d:\data.csv",sep=",")
print(d)

利用pandas读取中文数据集的方法

如果要选取某一行数据,可以使用head方法:

d.head(1)

其中参数是行号。

也可以直接取某一列,如:

d['色泽']

如果要取某一个数据则可以将两种方法结合使用:

d.head(1)['色泽']

以上这篇利用pandas读取中文数据集的方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python中使用gzip模块压缩文件的简单教程
Apr 08 Python
Python使用email模块对邮件进行编码和解码的实例教程
Jul 01 Python
python实现多线程抓取知乎用户
Dec 12 Python
使用Python对Excel进行读写操作
Mar 30 Python
python实现windows下文件备份脚本
May 27 Python
numpy.linspace函数具体使用详解
May 27 Python
解决py2exe打包后,总是多显示一个DOS黑色窗口的问题
Jun 21 Python
python读取Kafka实例
Dec 23 Python
Python内置数据类型list各方法的性能测试过程解析
Jan 07 Python
Python3.7下安装pyqt5的方法步骤(图文)
May 12 Python
python 深度学习中的4种激活函数
Sep 18 Python
Python下使用Trackbar实现绘图板
Oct 27 Python
利用pandas进行大文件计数处理的方法
Jul 25 #Python
使用python验证代理ip是否可用的实现方法
Jul 25 #Python
Python+Pandas 获取数据库并加入DataFrame的实例
Jul 25 #Python
python requests 测试代理ip是否生效
Jul 25 #Python
Python使用pymysql从MySQL数据库中读出数据的方法
Jul 25 #Python
Python统计python文件中代码,注释及空白对应的行数示例【测试可用】
Jul 25 #Python
Pandas读取MySQL数据到DataFrame的方法
Jul 25 #Python
You might like
桌面中心(二)数据库写入
2006/10/09 PHP
简单易用的计数器(数据库)
2006/10/09 PHP
php合并js请求的例子
2013/11/01 PHP
PHP 将dataurl转成图片image方法总结
2016/10/14 PHP
php实现水印文字和缩略图的方法示例
2016/12/29 PHP
yii插入数据库防并发的简单代码
2017/05/27 PHP
php实现根据身份证获取精准年龄
2020/02/26 PHP
基于jquery跨浏览器显示的file上传控件
2011/10/24 Javascript
NODE.JS加密模块CRYPTO常用方法介绍
2014/06/05 Javascript
解决jquery实现的radio重新选中的问题
2015/07/03 Javascript
javascript运动框架用法实例分析(实现放大与缩小效果)
2016/01/08 Javascript
功能强大的Bootstrap效果展示(二)
2016/08/03 Javascript
JS IOS/iPhone的Safari浏览器不兼容Javascript中的Date()问题如何解决
2016/11/11 Javascript
ES6中Array.find()和findIndex()函数的用法详解
2017/09/16 Javascript
实现一个完整的Node.js RESTful API的示例
2017/09/29 Javascript
利用Node.js批量抓取高清妹子图片实例教程
2018/08/02 Javascript
js实现AI五子棋人机大战
2020/05/28 Javascript
vue使用exif获取图片经纬度的示例代码
2020/12/11 Vue.js
Python(Tornado)模拟登录小米抢手机
2013/11/12 Python
Python中装饰器的一个妙用
2015/02/08 Python
python编程使用selenium模拟登陆淘宝实例代码
2018/01/25 Python
Python 字符串操作(string替换、删除、截取、复制、连接、比较、查找、包含、大小写转换、分割等)
2018/03/19 Python
python合并同类型excel表格的方法
2018/04/01 Python
transform python环境快速配置方法
2018/09/27 Python
python读写配置文件操作示例
2019/07/03 Python
Pandas分组与排序的实现
2019/07/23 Python
python点击鼠标获取坐标(Graphics)
2019/08/10 Python
详解KMP算法以及python如何实现
2020/09/18 Python
AmazeUI图片轮播效果的示例代码
2020/08/20 HTML / CSS
美国睫毛、眉毛精华液领导品牌:RevitaLash Cosmetics
2018/03/26 全球购物
中国制造网:Made-in-China.com
2019/10/25 全球购物
交通安全教育制度
2014/02/02 职场文书
致400米运动员广播稿
2014/02/07 职场文书
小区门卫的岗位职责
2014/09/26 职场文书
2015年社区居委会工作总结
2015/05/18 职场文书
用几道面试题来看JavaScript执行机制
2021/04/30 Javascript