Python读取数据集并消除数据中的空行方法


Posted in Python onJuly 12, 2018

如下所示:

# -*- coding: utf-8 -*-
# @ author hulei 2016-5-3
from numpy import *
import operator
from os import listdir
 
import sys
reload(sys)
sys.setdefaultencoding('utf8')
 
# x,y=getDataSet_dz('iris.data.txt',4)
 
def getDataSet(filename,numberOfFeature):  #将数据集读入内存 
 fr = open(filename)
 numberOfLines = len(fr.readlines())   #get the number of lines in the file file.readlines()是把文件的全部内容读到内存,并解析成一个list
 returnMat = zeros((numberOfLines,numberOfFeature))  #prepare matrix to return 3代表数据集中特征数目###
 classLabelVector = []      #prepare labels return 
 fr = open(filename)
 index = 0
 for line in fr.readlines():
  line = line.strip()     #strip() 参数为空时,默认删除空白符(包括'\n', '\r', '\t', ' ')
  listFromLine = line.split(',')   #split 以什么为标准分割一次 分成数组中的每个元素
  returnMat[index,:] = listFromLine[0:numberOfFeature] 
  #classLabelVector.append(int(listFromLine[-1])) #append() 方法向列表的尾部添加一个新的元素
  if listFromLine[-1] == 'Iris-setosa' :
   classLabelVector.append(1)
  elif listFromLine[-1] == 'Iris-versicolor' :
   classLabelVector.append(2)
  else:
  #elif listFromLine[-1] == 'Iris-virginica' :
   classLabelVector.append(3)
  index += 1
 return returnMat,classLabelVector
 
def getDataSet_dz(filename,numberOfFeature): #改进版,可以消除数据中的空白行
 numberOfLines = 0
 mx = []  #将数据集 去除空行后存入
 fr = open(filename)
 for line in fr.readlines():  
  line = line.strip() 
  if line != '' : #去除空白行 
   numberOfLines+=1
   mx.append( line.split(',') )
 returnMat = zeros((numberOfLines,numberOfFeature))
 classLabelVector = [] 
 for index in range(numberOfLines) :
  returnMat[index,:] = mx[index][0:numberOfFeature] 
  if mx[index][-1] == 'Iris-setosa' :
   classLabelVector.append(1)
  elif mx[index][-1] == 'Iris-versicolor' :
   classLabelVector.append(2)
  else:
  #elif listFromLine[-1] == 'Iris-virginica' :
   classLabelVector.append(3)
 return returnMat,classLabelVector

以上这篇Python读取数据集并消除数据中的空行方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python进程管理工具supervisor使用实例
Sep 17 Python
python网络编程之文件下载实例分析
May 20 Python
在Django的URLconf中进行函数导入的方法
Jul 18 Python
使用python 和 lint 删除项目无用资源的方法
Dec 20 Python
Python基于OpenCV实现视频的人脸检测
Jan 23 Python
python实现批量视频分帧、保存视频帧
May 31 Python
python 自定义装饰器实例详解
Jul 20 Python
利用Python校准本地时间的方法教程
Oct 31 Python
python实现输入的数据在地图上生成热力图效果
Dec 06 Python
Python生成个性签名图片获取GUI过程解析
Dec 16 Python
python使用yaml 管理selenium元素的示例
Dec 01 Python
call在Python中改进数列的实例讲解
Dec 09 Python
Python实现曲线拟合操作示例【基于numpy,scipy,matplotlib库】
Jul 12 #Python
python跳过第一行快速读取文件内容的实例
Jul 12 #Python
python 读取文本文件的行数据,文件.splitlines()的方法
Jul 12 #Python
Python实现的简单读写csv文件操作示例
Jul 12 #Python
用Python分析3天破10亿的《我不是药神》到底神在哪?
Jul 12 #Python
python之文件读取一行一行的方法
Jul 12 #Python
python 读取文件并替换字段的实例
Jul 12 #Python
You might like
php二维数组排序详解
2013/11/06 PHP
PHP四大安全策略
2014/03/12 PHP
JS异常处理try..catch语句的作用和实例
2014/05/05 PHP
PHP采集类Snoopy抓取图片实例
2014/06/19 PHP
php实现websocket实时消息推送
2018/03/30 PHP
IE的有条件注释判定IE版本详解(附实例代码)
2012/01/04 Javascript
使用jquery动态加载javascript以减少服务器压力
2012/10/29 Javascript
JQUERY dialog的用法详细解析
2013/12/19 Javascript
css如何让浮动元素水平居中
2015/08/07 Javascript
JavaScript对象数组的排序处理方法
2015/10/21 Javascript
使用Bootstrap框架制作查询页面的界面实例代码
2016/05/27 Javascript
浅析JavaScript中的平稳退化(graceful degradation)
2017/07/24 Javascript
解决React Native端口号修改的方法
2017/07/28 Javascript
Web开发使用Angular实现用户密码强度判别的方法
2017/09/27 Javascript
微信小程序getPhoneNumber获取用户手机号
2017/09/29 Javascript
JavaScript满天星导航栏实现方法
2018/03/08 Javascript
解决layui前端框架 form表单,table表等内置控件不显示的问题
2018/08/19 Javascript
webpack4 入门最简单的例子介绍
2018/09/05 Javascript
Vue学习之组件用法实例详解
2020/01/06 Javascript
阿望教你用vue写扫雷小游戏
2020/01/20 Javascript
微信小程序实现抖音播放效果的实例代码
2020/04/11 Javascript
OpenLayer3自定义测量控件MeasureTool
2020/09/28 Javascript
Django开发中的日志输出的方法
2018/07/02 Python
python pandas消除空值和空格以及 Nan数据替换方法
2018/10/30 Python
python中partial()基础用法说明
2018/12/30 Python
使用python的pandas为你的股票绘制趋势图
2019/06/26 Python
使用 Python 清理收藏夹里已失效的网站
2019/12/03 Python
关于tensorflow softmax函数用法解析
2020/06/30 Python
python录音并调用百度语音识别接口的示例
2020/12/01 Python
加拿大廉价机票预订网站:CheapOair.ca
2018/03/04 全球购物
2019年Java 最常见的 面试题
2016/10/19 面试题
Java如何调用外部Exe程序
2015/07/04 面试题
计算机本科生自荐信
2013/10/15 职场文书
《三峡》教学反思
2014/03/01 职场文书
人才市场接收函
2015/01/30 职场文书
中秋节感想
2015/08/10 职场文书