Python读取数据集并消除数据中的空行方法


Posted in Python onJuly 12, 2018

如下所示:

# -*- coding: utf-8 -*-
# @ author hulei 2016-5-3
from numpy import *
import operator
from os import listdir
 
import sys
reload(sys)
sys.setdefaultencoding('utf8')
 
# x,y=getDataSet_dz('iris.data.txt',4)
 
def getDataSet(filename,numberOfFeature):  #将数据集读入内存 
 fr = open(filename)
 numberOfLines = len(fr.readlines())   #get the number of lines in the file file.readlines()是把文件的全部内容读到内存,并解析成一个list
 returnMat = zeros((numberOfLines,numberOfFeature))  #prepare matrix to return 3代表数据集中特征数目###
 classLabelVector = []      #prepare labels return 
 fr = open(filename)
 index = 0
 for line in fr.readlines():
  line = line.strip()     #strip() 参数为空时,默认删除空白符(包括'\n', '\r', '\t', ' ')
  listFromLine = line.split(',')   #split 以什么为标准分割一次 分成数组中的每个元素
  returnMat[index,:] = listFromLine[0:numberOfFeature] 
  #classLabelVector.append(int(listFromLine[-1])) #append() 方法向列表的尾部添加一个新的元素
  if listFromLine[-1] == 'Iris-setosa' :
   classLabelVector.append(1)
  elif listFromLine[-1] == 'Iris-versicolor' :
   classLabelVector.append(2)
  else:
  #elif listFromLine[-1] == 'Iris-virginica' :
   classLabelVector.append(3)
  index += 1
 return returnMat,classLabelVector
 
def getDataSet_dz(filename,numberOfFeature): #改进版,可以消除数据中的空白行
 numberOfLines = 0
 mx = []  #将数据集 去除空行后存入
 fr = open(filename)
 for line in fr.readlines():  
  line = line.strip() 
  if line != '' : #去除空白行 
   numberOfLines+=1
   mx.append( line.split(',') )
 returnMat = zeros((numberOfLines,numberOfFeature))
 classLabelVector = [] 
 for index in range(numberOfLines) :
  returnMat[index,:] = mx[index][0:numberOfFeature] 
  if mx[index][-1] == 'Iris-setosa' :
   classLabelVector.append(1)
  elif mx[index][-1] == 'Iris-versicolor' :
   classLabelVector.append(2)
  else:
  #elif listFromLine[-1] == 'Iris-virginica' :
   classLabelVector.append(3)
 return returnMat,classLabelVector

以上这篇Python读取数据集并消除数据中的空行方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python的Flask框架中实现分页功能的教程
Apr 20 Python
Python的Tornado框架实现图片上传及图片大小修改功能
Jun 30 Python
python实现汉诺塔方法汇总
Jul 25 Python
Python自定义类的数组排序实现代码
Aug 28 Python
python select.select模块通信全过程解析
Sep 20 Python
Python实现基于C/S架构的聊天室功能详解
Jul 07 Python
Django框架登录加上验证码校验实现验证功能示例
May 23 Python
Python学习笔记基本数据结构之序列类型list tuple range用法分析
Jun 08 Python
在Django admin中编辑ManyToManyField的实现方法
Aug 09 Python
python使用celery实现异步任务执行的例子
Aug 28 Python
Python 通过爬虫实现GitHub网页的模拟登录的示例代码
Aug 17 Python
python 8种必备的gui库
Aug 27 Python
Python实现曲线拟合操作示例【基于numpy,scipy,matplotlib库】
Jul 12 #Python
python跳过第一行快速读取文件内容的实例
Jul 12 #Python
python 读取文本文件的行数据,文件.splitlines()的方法
Jul 12 #Python
Python实现的简单读写csv文件操作示例
Jul 12 #Python
用Python分析3天破10亿的《我不是药神》到底神在哪?
Jul 12 #Python
python之文件读取一行一行的方法
Jul 12 #Python
python 读取文件并替换字段的实例
Jul 12 #Python
You might like
PHP的开合式多级菜单程序
2006/10/09 PHP
同时提取多条新闻中的文本一例
2006/10/09 PHP
php中转义mysql语句的实现代码
2011/06/24 PHP
PHP中应该避免使用同名变量(拆分临时变量)
2015/04/03 PHP
谈谈PHP连接Access数据库的注意事项
2016/08/12 PHP
通用javascript脚本函数库 方便开发
2009/10/13 Javascript
Javascript动态绑定事件的简单实现代码
2010/12/25 Javascript
JavaScript高级程序设计(第3版)学习笔记10 再访js对象
2012/10/11 Javascript
js 判断js函数、变量是否存在的简单示例代码
2014/03/04 Javascript
js函数调用的方式
2014/05/06 Javascript
jQuery prototype冲突的2种解决方法(附demo示例下载)
2016/01/21 Javascript
详解Javascript中的Object对象
2016/02/28 Javascript
js前端实现图片懒加载(lazyload)的两种方式
2017/04/24 Javascript
微信小程序网络请求wx.request详解及实例
2017/05/18 Javascript
jquery DataTable实现前后台动态分页
2017/06/17 jQuery
angular框架实现全选与单选chekbox的自定义
2017/07/06 Javascript
JavaScript正则表达式校验与递归函数实际应用实例解析
2017/08/04 Javascript
jqueryUI tab标签页代码分享
2017/10/09 jQuery
JavaScript面向对象程序设计创建对象的方法分析
2018/08/13 Javascript
使用纯前端JavaScript实现Excel导入导出方法过程详解
2020/08/07 Javascript
Openlayers+EasyUI Tree动态实现图层控制
2020/09/28 Javascript
基于python实现KNN分类算法
2020/04/23 Python
Python3利用Dlib实现摄像头实时人脸检测和平铺显示示例
2019/02/21 Python
利用python numpy+matplotlib绘制股票k线图的方法
2019/06/26 Python
django之静态文件 django 2.0 在网页中显示图片的例子
2019/07/28 Python
HTML5 Canvas图像模糊完美解决办法
2018/02/06 HTML / CSS
台湾时尚彩瞳专门店:imeime
2019/08/16 全球购物
Talbots官网:美国成熟女装品牌
2019/11/15 全球购物
一岗双责责任书
2014/04/15 职场文书
小学生读书活动总结
2014/06/30 职场文书
诚实守信演讲稿
2014/09/01 职场文书
检查机关领导群众路线教育实践活动个人整改措施
2014/10/28 职场文书
英语导游词
2015/02/13 职场文书
2015年公司工作总结
2015/04/25 职场文书
大学学习委员竞选稿
2015/11/20 职场文书
vue el-table实现递归嵌套的示例代码
2022/08/14 Vue.js