Python读取数据集并消除数据中的空行方法


Posted in Python onJuly 12, 2018

如下所示:

# -*- coding: utf-8 -*-
# @ author hulei 2016-5-3
from numpy import *
import operator
from os import listdir
 
import sys
reload(sys)
sys.setdefaultencoding('utf8')
 
# x,y=getDataSet_dz('iris.data.txt',4)
 
def getDataSet(filename,numberOfFeature):  #将数据集读入内存 
 fr = open(filename)
 numberOfLines = len(fr.readlines())   #get the number of lines in the file file.readlines()是把文件的全部内容读到内存,并解析成一个list
 returnMat = zeros((numberOfLines,numberOfFeature))  #prepare matrix to return 3代表数据集中特征数目###
 classLabelVector = []      #prepare labels return 
 fr = open(filename)
 index = 0
 for line in fr.readlines():
  line = line.strip()     #strip() 参数为空时,默认删除空白符(包括'\n', '\r', '\t', ' ')
  listFromLine = line.split(',')   #split 以什么为标准分割一次 分成数组中的每个元素
  returnMat[index,:] = listFromLine[0:numberOfFeature] 
  #classLabelVector.append(int(listFromLine[-1])) #append() 方法向列表的尾部添加一个新的元素
  if listFromLine[-1] == 'Iris-setosa' :
   classLabelVector.append(1)
  elif listFromLine[-1] == 'Iris-versicolor' :
   classLabelVector.append(2)
  else:
  #elif listFromLine[-1] == 'Iris-virginica' :
   classLabelVector.append(3)
  index += 1
 return returnMat,classLabelVector
 
def getDataSet_dz(filename,numberOfFeature): #改进版,可以消除数据中的空白行
 numberOfLines = 0
 mx = []  #将数据集 去除空行后存入
 fr = open(filename)
 for line in fr.readlines():  
  line = line.strip() 
  if line != '' : #去除空白行 
   numberOfLines+=1
   mx.append( line.split(',') )
 returnMat = zeros((numberOfLines,numberOfFeature))
 classLabelVector = [] 
 for index in range(numberOfLines) :
  returnMat[index,:] = mx[index][0:numberOfFeature] 
  if mx[index][-1] == 'Iris-setosa' :
   classLabelVector.append(1)
  elif mx[index][-1] == 'Iris-versicolor' :
   classLabelVector.append(2)
  else:
  #elif listFromLine[-1] == 'Iris-virginica' :
   classLabelVector.append(3)
 return returnMat,classLabelVector

以上这篇Python读取数据集并消除数据中的空行方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
闭包在python中的应用之translate和maketrans用法详解
Aug 27 Python
跟老齐学Python之一个免费的实验室
Sep 14 Python
python多线程socket编程之多客户端接入
Sep 12 Python
python3 读写文件换行符的方法
Apr 09 Python
Python模拟浏览器上传文件脚本的方法(Multipart/form-data格式)
Oct 22 Python
啥是佩奇?使用Python自动绘画小猪佩奇的代码实例
Feb 20 Python
关于pycharm中pip版本10.0无法使用的解决办法
Oct 10 Python
python环境下安装opencv库的方法
Mar 05 Python
Python request操作步骤及代码实例
Apr 13 Python
Python使用pyexecjs代码案例解析
Jul 13 Python
python向企业微信发送文字和图片消息的示例
Sep 28 Python
python实现代码审查自动回复消息
Feb 01 Python
Python实现曲线拟合操作示例【基于numpy,scipy,matplotlib库】
Jul 12 #Python
python跳过第一行快速读取文件内容的实例
Jul 12 #Python
python 读取文本文件的行数据,文件.splitlines()的方法
Jul 12 #Python
Python实现的简单读写csv文件操作示例
Jul 12 #Python
用Python分析3天破10亿的《我不是药神》到底神在哪?
Jul 12 #Python
python之文件读取一行一行的方法
Jul 12 #Python
python 读取文件并替换字段的实例
Jul 12 #Python
You might like
PHP实现的交通银行网银在线支付接口ECSHOP插件和使用例子
2014/05/10 PHP
php从完整文件路径中分离文件目录和文件名的方法
2015/03/13 PHP
codeigniter显示所有脚本执行时间的方法
2015/03/21 PHP
关于javascript 回调函数中变量作用域的讨论
2009/09/11 Javascript
jQuery的链式调用浅析
2010/12/03 Javascript
JQuery中$.ajax()方法参数详解及应用
2013/12/12 Javascript
jquery实现简单的自动播放幻灯片效果
2015/06/13 Javascript
JSON字符串转JSON对象
2015/07/31 Javascript
JS简单实现多级Select联动菜单效果代码
2015/09/06 Javascript
基于insertBefore制作简单的循环插空效果
2015/09/21 Javascript
javascript函数式编程程序员的工具集
2015/10/11 Javascript
IE8利用自带的setCapture和releaseCapture解决iframe的拖拽事件方法
2016/10/25 Javascript
javascript 组合按键事件监听实现代码
2017/02/21 Javascript
Vue项目总结之webpack常规打包优化方案
2019/06/06 Javascript
详解vue中$nextTick和$forceUpdate的用法
2019/12/11 Javascript
微信小程序搜索框样式并实现跳转到搜索页面(小程序搜索功能)
2020/03/10 Javascript
jQuery实现增删改查
2020/12/22 jQuery
[03:08]TI9战队档案 - Vici Gaming
2019/08/20 DOTA
Python函数返回值实例分析
2015/06/08 Python
python使用PIL实现多张图片垂直合并
2019/01/15 Python
Python实例方法、类方法、静态方法的区别与作用详解
2019/03/25 Python
详解Python3 对象组合zip()和回退方式*zip
2019/05/15 Python
解决Alexnet训练模型在每个epoch中准确率和loss都会一升一降问题
2020/06/17 Python
iframe与window.onload如何使用详解
2020/05/07 HTML / CSS
怎样声明子类
2013/07/02 面试题
中专毕业自我鉴定
2013/10/16 职场文书
公司道歉信范文
2014/01/09 职场文书
服装设计专业毕业生求职信
2014/04/09 职场文书
网吧消防安全责任书
2014/07/29 职场文书
2015年综治维稳工作总结
2015/04/07 职场文书
2015年学校保卫部工作总结
2015/05/11 职场文书
2016婚礼主持词开场白
2015/11/24 职场文书
python 爬取吉首大学网站成绩单
2021/06/02 Python
python 实现图片特效处理
2022/04/03 Python
CSS 鼠标点击拖拽效果的实现代码
2022/12/24 HTML / CSS
SqlServer常用函数及时间处理小结
2023/05/08 SQL Server