Python读取数据集并消除数据中的空行方法


Posted in Python onJuly 12, 2018

如下所示:

# -*- coding: utf-8 -*-
# @ author hulei 2016-5-3
from numpy import *
import operator
from os import listdir
 
import sys
reload(sys)
sys.setdefaultencoding('utf8')
 
# x,y=getDataSet_dz('iris.data.txt',4)
 
def getDataSet(filename,numberOfFeature):  #将数据集读入内存 
 fr = open(filename)
 numberOfLines = len(fr.readlines())   #get the number of lines in the file file.readlines()是把文件的全部内容读到内存,并解析成一个list
 returnMat = zeros((numberOfLines,numberOfFeature))  #prepare matrix to return 3代表数据集中特征数目###
 classLabelVector = []      #prepare labels return 
 fr = open(filename)
 index = 0
 for line in fr.readlines():
  line = line.strip()     #strip() 参数为空时,默认删除空白符(包括'\n', '\r', '\t', ' ')
  listFromLine = line.split(',')   #split 以什么为标准分割一次 分成数组中的每个元素
  returnMat[index,:] = listFromLine[0:numberOfFeature] 
  #classLabelVector.append(int(listFromLine[-1])) #append() 方法向列表的尾部添加一个新的元素
  if listFromLine[-1] == 'Iris-setosa' :
   classLabelVector.append(1)
  elif listFromLine[-1] == 'Iris-versicolor' :
   classLabelVector.append(2)
  else:
  #elif listFromLine[-1] == 'Iris-virginica' :
   classLabelVector.append(3)
  index += 1
 return returnMat,classLabelVector
 
def getDataSet_dz(filename,numberOfFeature): #改进版,可以消除数据中的空白行
 numberOfLines = 0
 mx = []  #将数据集 去除空行后存入
 fr = open(filename)
 for line in fr.readlines():  
  line = line.strip() 
  if line != '' : #去除空白行 
   numberOfLines+=1
   mx.append( line.split(',') )
 returnMat = zeros((numberOfLines,numberOfFeature))
 classLabelVector = [] 
 for index in range(numberOfLines) :
  returnMat[index,:] = mx[index][0:numberOfFeature] 
  if mx[index][-1] == 'Iris-setosa' :
   classLabelVector.append(1)
  elif mx[index][-1] == 'Iris-versicolor' :
   classLabelVector.append(2)
  else:
  #elif listFromLine[-1] == 'Iris-virginica' :
   classLabelVector.append(3)
 return returnMat,classLabelVector

以上这篇Python读取数据集并消除数据中的空行方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python实现的一个自动售饮料程序代码分享
Aug 25 Python
Python的Bottle框架的一些使用技巧介绍
Apr 08 Python
利用Python命令行传递实例化对象的方法
Nov 02 Python
Python实现按逗号分隔列表的方法
Oct 23 Python
Python中函数参数匹配模型详解
Jun 09 Python
Python求两点之间的直线距离(2种实现方法)
Jul 07 Python
Pycharm 文件更改目录后,执行路径未更新的解决方法
Jul 19 Python
在Python中append以及extend返回None的例子
Jul 20 Python
Python GUI库PyQt5图形和特效样式QSS介绍
Feb 25 Python
Python深度学习之Pytorch初步使用
May 20 Python
基于flask实现五子棋小游戏
May 25 Python
Python 数据可视化工具 Pyecharts 安装及应用
Apr 20 Python
Python实现曲线拟合操作示例【基于numpy,scipy,matplotlib库】
Jul 12 #Python
python跳过第一行快速读取文件内容的实例
Jul 12 #Python
python 读取文本文件的行数据,文件.splitlines()的方法
Jul 12 #Python
Python实现的简单读写csv文件操作示例
Jul 12 #Python
用Python分析3天破10亿的《我不是药神》到底神在哪?
Jul 12 #Python
python之文件读取一行一行的方法
Jul 12 #Python
python 读取文件并替换字段的实例
Jul 12 #Python
You might like
DC《小丑》11项提名领跑奥斯卡 Netflix成第92届奥斯卡提名最大赢家
2020/04/09 欧美动漫
ezSQL PHP数据库操作类库
2010/05/16 PHP
php判断页面是否是微信打开的示例(微信打开网页)
2014/04/25 PHP
php实现文件下载代码分享
2014/08/19 PHP
ThinkPHP整合百度Ueditor图文教程
2014/10/21 PHP
Laravel中如何增加自定义全局函数详解
2017/05/09 PHP
使用 PHP Masked Package 屏蔽敏感数据的实现方法
2019/10/15 PHP
$()JS小技巧
2007/07/21 Javascript
js导出格式化的excel 实例方法
2013/07/17 Javascript
Jquery节点遍历next与nextAll方法使用示例
2014/07/22 Javascript
jQuery实现模拟marquee标签效果
2015/07/14 Javascript
JS实现超简单的鼠标拖动效果
2015/11/02 Javascript
javascript实现input file上传图片预览效果
2015/12/31 Javascript
jQuery简单设置文本框回车事件的方法
2016/08/01 Javascript
jQuery插件ajaxFileUpload使用实例解析
2016/10/19 Javascript
在JSP中如何实现MD5加密的方法
2016/11/02 Javascript
jQuery实现可拖拽3D万花筒旋转特效
2017/01/03 Javascript
Jquery与Bootstrap实现后台管理页面增删改查功能示例
2017/01/22 Javascript
微信小程序 动态的设置图片的高度和宽度详解及实例代码
2017/02/24 Javascript
React Native中Navigator的使用方法示例
2017/10/13 Javascript
图片懒加载imgLazyLoading.js使用详解
2020/09/15 Javascript
JS使用setInterval实现的简单计时器功能示例
2018/04/19 Javascript
JS实现倒计时图文效果
2018/11/17 Javascript
Node.js系列之发起get/post请求(2)
2019/08/30 Javascript
layui 表格操作列按钮动态显示的实现方法
2019/09/06 Javascript
Node.js path模块,获取文件后缀名操作
2020/11/07 Javascript
Python socket模块方法实现详解
2019/11/05 Python
Python for循环通过序列索引迭代过程解析
2020/02/07 Python
Python通过Tesseract库实现文字识别
2020/03/05 Python
加拿大床上用品、家居装饰、厨房和浴室产品购物网站:Linen Chest
2018/06/05 全球购物
国庆节文艺活动方案
2014/02/03 职场文书
《我的信念》教学反思
2014/02/15 职场文书
考试作弊被抓检讨书
2014/10/02 职场文书
党员示范岗材料
2014/12/19 职场文书
学会Python数据可视化必须尝试这7个库
2021/06/16 Python
一文搞懂Golang 时间和日期相关函数
2021/12/06 Golang