利用pandas读取中文数据集的方法


Posted in Python onJuly 25, 2018

直接利用numpy读取非数字型的数据集时需要先进行转换,而且python3在处理中文数据方面确实比较蛋疼。最近在学习周志华老师的那本西瓜书,需要没事和一堆西瓜反复较劲,之前进行联系的时候都是利用批量替换先清理一遍数据,不过这样实在是太麻烦了,今天偶然发现可以使用pandas来实现读取中文数据集的功能。

首先分享一下数据集:

编号,色泽,根蒂,敲声,纹理,脐部,触感,密度,含糖率,好瓜 
1,青绿,蜷缩,浊响,清晰,凹陷,硬滑,0.697,0.46,是 
2,乌黑,蜷缩,沉闷,清晰,凹陷,硬滑,0.774,0.376,是 
3,乌黑,蜷缩,浊响,清晰,凹陷,硬滑,0.634,0.264,是 
4,青绿,蜷缩,沉闷,清晰,凹陷,硬滑,0.608,0.318,是 
5,浅白,蜷缩,浊响,清晰,凹陷,硬滑,0.556,0.215,是 
6,青绿,稍蜷,浊响,清晰,稍凹,软粘,0.403,0.237,是 
7,乌黑,稍蜷,浊响,稍糊,稍凹,软粘,0.481,0.149,是 
8,乌黑,稍蜷,浊响,清晰,稍凹,硬滑,0.437,0.211,是 
9,乌黑,稍蜷,沉闷,稍糊,稍凹,硬滑,0.666,0.091,否 
10,青绿,硬挺,清脆,清晰,平坦,软粘,0.243,0.267,否 
11,浅白,硬挺,清脆,模糊,平坦,硬滑,0.245,0.057,否 
12,浅白,蜷缩,浊响,模糊,平坦,软粘,0.343,0.099,否 
13,青绿,稍蜷,浊响,稍糊,凹陷,硬滑,0.639,0.161,否 
14,浅白,稍蜷,沉闷,稍糊,凹陷,硬滑,0.657,0.198,否 
15,乌黑,稍蜷,浊响,清晰,稍凹,软粘,0.36,0.37,否 
16,浅白,蜷缩,浊响,模糊,平坦,硬滑,0.593,0.042,否 
17,青绿,蜷缩,沉闷,稍糊,稍凹,硬滑,0.719,0.103,否

然后利用pandas将它读进来:

import pandas
d = pandas.read_csv(r"d:\data.csv",sep=",")
print(d)

利用pandas读取中文数据集的方法

如果要选取某一行数据,可以使用head方法:

d.head(1)

其中参数是行号。

也可以直接取某一列,如:

d['色泽']

如果要取某一个数据则可以将两种方法结合使用:

d.head(1)['色泽']

以上这篇利用pandas读取中文数据集的方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python 3.x 新特性及10大变化
Jun 12 Python
python实现备份目录的方法
Aug 03 Python
Python基于分水岭算法解决走迷宫游戏示例
Sep 26 Python
python traceback捕获并打印异常的方法
Aug 31 Python
Python3爬虫学习之应对网站反爬虫机制的方法分析
Dec 12 Python
python实现雪花飘落效果实例讲解
Jun 18 Python
pandas DataFrame 警告(SettingWithCopyWarning)的解决
Jul 23 Python
python 变量初始化空列表的例子
Nov 28 Python
Python PyInstaller安装和使用教程详解
Jan 08 Python
解决pyqt5异常退出无提示信息的问题
Apr 08 Python
JupyterNotebook 输出窗口的显示效果调整实现
Sep 22 Python
Python实现智慧校园自动评教全新版
Jun 18 Python
利用pandas进行大文件计数处理的方法
Jul 25 #Python
使用python验证代理ip是否可用的实现方法
Jul 25 #Python
Python+Pandas 获取数据库并加入DataFrame的实例
Jul 25 #Python
python requests 测试代理ip是否生效
Jul 25 #Python
Python使用pymysql从MySQL数据库中读出数据的方法
Jul 25 #Python
Python统计python文件中代码,注释及空白对应的行数示例【测试可用】
Jul 25 #Python
Pandas读取MySQL数据到DataFrame的方法
Jul 25 #Python
You might like
用PHP+java实现自动新闻滚动窗口
2006/10/09 PHP
PHP面向对象程序设计(OOP)之方法重写(override)操作示例
2018/12/21 PHP
详解PHP变量传值赋值和引用赋值变量销毁
2019/03/23 PHP
jquery图片切换实例分析
2015/04/15 Javascript
jQuery中的siblings用法实例分析
2015/12/24 Javascript
浅谈JavaScript的自动垃圾收集机制
2016/12/15 Javascript
jQuery模拟下拉框选择对应菜单的内容
2017/03/07 Javascript
深入理解Nodejs Global 模块
2017/06/03 NodeJs
jQuery remove()过滤被删除的元素(推荐)
2017/07/18 jQuery
详解从零搭建 vue2 vue-router2 webpack3 工程
2017/11/22 Javascript
如何使用CSS3+JQuery实现悬浮墙式菜单
2019/06/18 jQuery
微信小程序登录对接Django后端实现JWT方式验证登录详解
2019/07/29 Javascript
Vue实现商品详情页的评价列表功能
2019/09/04 Javascript
Python抓取聚划算商品分析页面获取商品信息并以XML格式保存到本地
2018/02/23 Python
python 统计数组中元素出现次数并进行排序的实例
2018/07/02 Python
Python日期时间Time模块实例详解
2019/04/15 Python
对django views中 request, response的常用操作详解
2019/07/17 Python
关于tf.TFRecordReader()函数的用法解析
2020/02/17 Python
浅谈Python中os模块及shutil模块的常规操作
2020/04/03 Python
PyCharm2020.1.1与Python3.7.7的安装教程图文详解
2020/08/07 Python
简单掌握CSS3将文字描边及填充文字颜色的方法
2016/03/07 HTML / CSS
Desigual英国官网:在线购买原创服装
2018/03/09 全球购物
如何在C# winform中异步调用web services
2015/09/21 面试题
区域总监的岗位职责
2013/11/21 职场文书
蛋糕店的商业计划书范文
2014/01/27 职场文书
会员卡清退活动总结
2014/08/27 职场文书
2014年党的群众路线学习心得体会
2014/11/05 职场文书
作文评语怎么写
2014/12/25 职场文书
淘宝好评语句大全
2014/12/31 职场文书
死者家属慰问信
2015/03/24 职场文书
2015年乡镇信访工作总结
2015/04/07 职场文书
离婚案件答辩状
2015/05/22 职场文书
合作意向书怎么写
2019/06/24 职场文书
2019教师的学习计划
2019/06/25 职场文书
Django程序的优化技巧
2021/04/29 Python
vue完美实现el-table列宽自适应
2021/05/08 Vue.js