Python读取数据集并消除数据中的空行方法


Posted in Python onJuly 12, 2018

如下所示:

# -*- coding: utf-8 -*-
# @ author hulei 2016-5-3
from numpy import *
import operator
from os import listdir
 
import sys
reload(sys)
sys.setdefaultencoding('utf8')
 
# x,y=getDataSet_dz('iris.data.txt',4)
 
def getDataSet(filename,numberOfFeature):  #将数据集读入内存 
 fr = open(filename)
 numberOfLines = len(fr.readlines())   #get the number of lines in the file file.readlines()是把文件的全部内容读到内存,并解析成一个list
 returnMat = zeros((numberOfLines,numberOfFeature))  #prepare matrix to return 3代表数据集中特征数目###
 classLabelVector = []      #prepare labels return 
 fr = open(filename)
 index = 0
 for line in fr.readlines():
  line = line.strip()     #strip() 参数为空时,默认删除空白符(包括'\n', '\r', '\t', ' ')
  listFromLine = line.split(',')   #split 以什么为标准分割一次 分成数组中的每个元素
  returnMat[index,:] = listFromLine[0:numberOfFeature] 
  #classLabelVector.append(int(listFromLine[-1])) #append() 方法向列表的尾部添加一个新的元素
  if listFromLine[-1] == 'Iris-setosa' :
   classLabelVector.append(1)
  elif listFromLine[-1] == 'Iris-versicolor' :
   classLabelVector.append(2)
  else:
  #elif listFromLine[-1] == 'Iris-virginica' :
   classLabelVector.append(3)
  index += 1
 return returnMat,classLabelVector
 
def getDataSet_dz(filename,numberOfFeature): #改进版,可以消除数据中的空白行
 numberOfLines = 0
 mx = []  #将数据集 去除空行后存入
 fr = open(filename)
 for line in fr.readlines():  
  line = line.strip() 
  if line != '' : #去除空白行 
   numberOfLines+=1
   mx.append( line.split(',') )
 returnMat = zeros((numberOfLines,numberOfFeature))
 classLabelVector = [] 
 for index in range(numberOfLines) :
  returnMat[index,:] = mx[index][0:numberOfFeature] 
  if mx[index][-1] == 'Iris-setosa' :
   classLabelVector.append(1)
  elif mx[index][-1] == 'Iris-versicolor' :
   classLabelVector.append(2)
  else:
  #elif listFromLine[-1] == 'Iris-virginica' :
   classLabelVector.append(3)
 return returnMat,classLabelVector

以上这篇Python读取数据集并消除数据中的空行方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python与php实现分割文件代码
Mar 06 Python
Python实现抓取网页生成Excel文件的方法示例
Aug 05 Python
使用Python+Splinter自动刷新抢12306火车票
Jan 03 Python
Python实现重建二叉树的三种方法详解
Jun 23 Python
python之super的使用小结
Aug 13 Python
django中ORM模型常用的字段的使用方法
Mar 05 Python
python pytest进阶之fixture详解
Jun 27 Python
python统计函数库scipy.stats的用法解析
Feb 25 Python
Python基于jieba, wordcloud库生成中文词云
May 13 Python
python入门:argparse浅析 nargs='+'作用
Jul 12 Python
pycharm 2020.2.4 pip install Flask 报错 Error:Non-zero exit code的问题
Dec 04 Python
python 生成正态分布数据,并绘图和解析
Dec 21 Python
Python实现曲线拟合操作示例【基于numpy,scipy,matplotlib库】
Jul 12 #Python
python跳过第一行快速读取文件内容的实例
Jul 12 #Python
python 读取文本文件的行数据,文件.splitlines()的方法
Jul 12 #Python
Python实现的简单读写csv文件操作示例
Jul 12 #Python
用Python分析3天破10亿的《我不是药神》到底神在哪?
Jul 12 #Python
python之文件读取一行一行的方法
Jul 12 #Python
python 读取文件并替换字段的实例
Jul 12 #Python
You might like
PHP面向对象三大特点学习(充分理解抽象、封装、继承、多态)
2012/05/07 PHP
解析php安全性问题中的:Null 字符问题
2013/06/21 PHP
destoon之一键登录设置
2014/06/21 PHP
浅析php原型模式
2014/11/25 PHP
如何使用PHP对网站验证码进行破解
2015/09/17 PHP
PHP中的静态变量及static静态变量使用详解
2015/11/05 PHP
详解json在php中的应用
2018/09/30 PHP
php中钩子(hook)的原理与简单应用demo示例
2019/09/03 PHP
根据分辨率不同,调用不同的css文件
2006/08/25 Javascript
通过修改referer下载文件的方法
2008/05/11 Javascript
jquery dialog键盘事件代码
2010/08/01 Javascript
jQuery对象的selector属性用法实例
2014/12/27 Javascript
node爬取微博的数据的简单封装库nodeweibo使用指南
2015/01/02 Javascript
js实现下拉框效果(select)
2017/03/28 Javascript
JavaScript对JSON数据进行排序和搜索
2017/07/24 Javascript
js实现日期显示的一些操作(实例讲解)
2017/07/27 Javascript
vue移动端的左右滑动事件详解
2020/06/17 Javascript
探索node之事件循环的实现
2020/10/30 Javascript
[03:46]显微镜下的DOTA2第七期——满血与残血
2014/06/20 DOTA
python计算N天之后日期的方法
2015/03/31 Python
简单介绍Python中的JSON模块
2015/04/08 Python
Python遍历指定文件及文件夹的方法
2015/05/09 Python
读取本地json文件,解析json(实例讲解)
2017/12/06 Python
PyQt5每天必学之日历控件QCalendarWidget
2018/04/19 Python
Python实现计算文件MD5和SHA1的方法示例
2019/06/11 Python
Python多版本开发环境管理工具介绍
2019/07/03 Python
python清空命令行方式
2020/01/13 Python
六种酷炫Python运行进度条效果的实现代码
2020/07/17 Python
python中entry用法讲解
2020/12/04 Python
Html5游戏开发之乒乓Ping Pong游戏示例(一)
2013/01/21 HTML / CSS
GLAMGLOW格莱魅美国官网:美国知名的面膜品牌
2016/12/31 全球购物
统计每一学生的平均成绩
2014/06/06 面试题
30年同学聚会邀请函
2014/01/25 职场文书
作文批改评语
2014/12/25 职场文书
英语读书笔记
2015/07/02 职场文书
Python经常使用的一些内置函数
2022/04/11 Python