编程 Python

Python读取数据集并消除数据中的空行方法

Posted in Python onJuly 12, 2018

如下所示：

# -*- coding: utf-8 -*-
# @ author hulei 2016-5-3
from numpy import *
import operator
from os import listdir
 
import sys
reload(sys)
sys.setdefaultencoding('utf8')
 
# x,y=getDataSet_dz('iris.data.txt',4)
 
def getDataSet(filename,numberOfFeature):  #将数据集读入内存 
 fr = open(filename)
 numberOfLines = len(fr.readlines())   #get the number of lines in the file file.readlines()是把文件的全部内容读到内存，并解析成一个list
 returnMat = zeros((numberOfLines,numberOfFeature))  #prepare matrix to return 3代表数据集中特征数目###
 classLabelVector = []      #prepare labels return 
 fr = open(filename)
 index = 0
 for line in fr.readlines():
  line = line.strip()     #strip() 参数为空时，默认删除空白符（包括'\n', '\r', '\t', ' ')
  listFromLine = line.split(',')   #split 以什么为标准分割一次 分成数组中的每个元素
  returnMat[index,:] = listFromLine[0:numberOfFeature] 
  #classLabelVector.append(int(listFromLine[-1])) #append() 方法向列表的尾部添加一个新的元素
  if listFromLine[-1] == 'Iris-setosa' :
   classLabelVector.append(1)
  elif listFromLine[-1] == 'Iris-versicolor' :
   classLabelVector.append(2)
  else:
  #elif listFromLine[-1] == 'Iris-virginica' :
   classLabelVector.append(3)
  index += 1
 return returnMat,classLabelVector
 
def getDataSet_dz(filename,numberOfFeature): #改进版，可以消除数据中的空白行
 numberOfLines = 0
 mx = []  #将数据集 去除空行后存入
 fr = open(filename)
 for line in fr.readlines():  
  line = line.strip() 
  if line != '' : #去除空白行 
   numberOfLines+=1
   mx.append( line.split(',') )
 returnMat = zeros((numberOfLines,numberOfFeature))
 classLabelVector = [] 
 for index in range(numberOfLines) :
  returnMat[index,:] = mx[index][0:numberOfFeature] 
  if mx[index][-1] == 'Iris-setosa' :
   classLabelVector.append(1)
  elif mx[index][-1] == 'Iris-versicolor' :
   classLabelVector.append(2)
  else:
  #elif listFromLine[-1] == 'Iris-virginica' :
   classLabelVector.append(3)
 return returnMat,classLabelVector

以上这篇Python读取数据集并消除数据中的空行方法就是小编分享给大家的全部内容了，希望能给大家一个参考，也希望大家多多支持三水点靠木。

- Author -

AlistarHu

声明：登载此文出于传递更多信息之目的，并不意味着赞同其观点或证实其描述。

Python 相关文章推荐

闭包在python中的应用之translate和maketrans用法详解

Aug 27 Python

跟老齐学Python之一个免费的实验室

Sep 14 Python

python多线程socket编程之多客户端接入

Sep 12 Python

python3 读写文件换行符的方法

Apr 09 Python

Python模拟浏览器上传文件脚本的方法(Multipart/form-data格式)

Oct 22 Python

啥是佩奇?使用Python自动绘画小猪佩奇的代码实例

Feb 20 Python

关于pycharm中pip版本10.0无法使用的解决办法

Oct 10 Python

python环境下安装opencv库的方法

Mar 05 Python

Python request操作步骤及代码实例

Apr 13 Python

Python使用pyexecjs代码案例解析

Jul 13 Python

python向企业微信发送文字和图片消息的示例

Sep 28 Python

python实现代码审查自动回复消息

Feb 01 Python

Python实现曲线拟合操作示例【基于numpy,scipy,matplotlib库】

Jul 12 #Python

python跳过第一行快速读取文件内容的实例

Jul 12 #Python

python 读取文本文件的行数据,文件.splitlines()的方法

Jul 12 #Python

Python实现的简单读写csv文件操作示例

Jul 12 #Python

用Python分析3天破10亿的《我不是药神》到底神在哪?

Jul 12 #Python

python之文件读取一行一行的方法

Jul 12 #Python

python 读取文件并替换字段的实例

Jul 12 #Python

You might like

PHP实现的交通银行网银在线支付接口ECSHOP插件和使用例子

2014/05/10 PHP

php从完整文件路径中分离文件目录和文件名的方法

2015/03/13 PHP

codeigniter显示所有脚本执行时间的方法

2015/03/21 PHP

关于javascript 回调函数中变量作用域的讨论

2009/09/11 Javascript

jQuery的链式调用浅析

2010/12/03 Javascript

JQuery中$.ajax()方法参数详解及应用

2013/12/12 Javascript

jquery实现简单的自动播放幻灯片效果

2015/06/13 Javascript

JSON字符串转JSON对象

2015/07/31 Javascript

JS简单实现多级Select联动菜单效果代码

2015/09/06 Javascript

基于insertBefore制作简单的循环插空效果

2015/09/21 Javascript

javascript函数式编程程序员的工具集

2015/10/11 Javascript

IE8利用自带的setCapture和releaseCapture解决iframe的拖拽事件方法

2016/10/25 Javascript

javascript 组合按键事件监听实现代码

2017/02/21 Javascript

Vue项目总结之webpack常规打包优化方案

2019/06/06 Javascript

详解vue中$nextTick和$forceUpdate的用法

2019/12/11 Javascript

微信小程序搜索框样式并实现跳转到搜索页面(小程序搜索功能)

2020/03/10 Javascript

jQuery实现增删改查

2020/12/22 jQuery

[03:08]TI9战队档案 - Vici Gaming

2019/08/20 DOTA

Python函数返回值实例分析

2015/06/08 Python

python使用PIL实现多张图片垂直合并

2019/01/15 Python

Python实例方法、类方法、静态方法的区别与作用详解

2019/03/25 Python

详解Python3 对象组合zip()和回退方式*zip

2019/05/15 Python

解决Alexnet训练模型在每个epoch中准确率和loss都会一升一降问题

2020/06/17 Python

iframe与window.onload如何使用详解

2020/05/07 HTML / CSS

怎样声明子类

2013/07/02 面试题

中专毕业自我鉴定

2013/10/16 职场文书

公司道歉信范文

2014/01/09 职场文书

服装设计专业毕业生求职信

2014/04/09 职场文书

网吧消防安全责任书

2014/07/29 职场文书

2015年综治维稳工作总结

2015/04/07 职场文书

2015年学校保卫部工作总结

2015/05/11 职场文书

2016婚礼主持词开场白

2015/11/24 职场文书

python 爬取吉首大学网站成绩单

2021/06/02 Python

python 实现图片特效处理

2022/04/03 Python

CSS 鼠标点击拖拽效果的实现代码

2022/12/24 HTML / CSS

SqlServer常用函数及时间处理小结

2023/05/08 SQL Server