python 使用pandas读取csv文件的方法


Posted in Python onDecember 24, 2022

在这里记录一下,python使用pandas读取文件的方法
用到pandas库的read_csv函数

# -*- coding: utf-8 -*-
"""
Created on Mon Jan 24 16:48:32 2022

@author: zxy
"""

# 导入包
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import matplotlib.gridspec as gridspec
import seaborn as sns; plt.style.use('ggplot')

import sklearn
from sklearn.preprocessing import StandardScaler
from sklearn.model_selection import train_test_split
from sklearn.utils import shuffle
from sklearn.metrics import confusion_matrix
from sklearn.manifold import TSNE

# 导入并查看数据
crecreditcard_data=pd.read_csv('./creditcard.csv')
crecreditcard_data.shape,crecreditcard_data.info()

crecreditcard_data.describe()


crecreditcard_data.head()

# 看看欺诈与非欺诈的比例如何
count_classes=pd.value_counts(crecreditcard_data['Class'],sort=True).sort_index()

# 统计下具体数据
count_classes.value_counts()
# 也可以用count_classes[0],count_classes[1]看分别数据

count_classes.plot(kind='bar')
plt.show()

知识点扩展:

pandas读取csv文件的操作

1. 读取csv文件

import pandas as pd
import numpy as np
 
# 读取整个csv文件
csv_data = pd.read_csv("./stock_day.csv")
 
# 读取指定列索引字段的数据
csv_data = pd.read_csv("./stock_day.csv", usecols=['open', 'close'])
 
# 将我们修改完的csv的文件保存到新的路径下
csv_data.to_csv('demo.csv')

观察我们保存的文件的格式(行索引为我们的日期, 列索引为 open close) :

python 使用pandas读取csv文件的方法

# 查看新保存的文件
new_data = read_csv('./demo.csv')

观察新保存的文件(我们在读取的时候默认给我们添加了新的行索引, 及Unnamed:0): 

python 使用pandas读取csv文件的方法

使用to_csv的时候, 我们可以给他传入几个参数:

csv_data.to_csv('demo.csv', header=True, index=False)

 

python 使用pandas读取csv文件的方法

to_csv这个方法中可以传递一些参数:

 DataFrame.to_csv(path_or_buf=None, sep=', ’, columns=None, header=True, index=True, index_label=None, mode='w', encoding=None)

  • path_or_buf :文件保存的路径;
  • sep :默认是以 , 进行分割 , 也可以自己制定;
  • columns : 保存索引列和指定列;
  • index:是否写进行索引 0或者1;
  • header :boolean or list of string, default True,是否写进列索引值 0或者 1;
  • na_rep=NaN: 缺失值保存为Na 如果不写 默认为空;
  • float_format='%.2f' :保留两位小数;

再来回顾一下将我们的行索引装成日期格式的方法:

# 生成一个时间的序列,略过周末非交易日
date = pd.date_range('2018-02-27', periods=new_data.shape[1], freq='B')
 
# index代表行索引,columns代表列索引
new_data = pd.DataFrame(new_data, index=date)

到此这篇关于python 使用pandas读取csv文件的方法的文章就介绍到这了,更多相关python 读取csv文件内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
python实现html转ubb代码(html2ubb)
Jul 03 Python
利用Django框架中select_related和prefetch_related函数对数据库查询优化
Apr 01 Python
详解Python之数据序列化(json、pickle、shelve)
Mar 30 Python
python解决js文件utf-8编码乱码问题(推荐)
May 02 Python
python实现大文件分割与合并
Jul 22 Python
python制作英语翻译小工具代码实例
Sep 09 Python
python pprint模块中print()和pprint()两者的区别
Feb 10 Python
Python通过Pillow实现图片对比
Apr 29 Python
keras的siamese(孪生网络)实现案例
Jun 12 Python
在 Windows 下搭建高效的 django 开发环境的详细教程
Jul 27 Python
Python爬虫爬取ts碎片视频+验证码登录功能
Feb 22 Python
Python图像处理库PIL详细使用说明
Apr 06 Python
Python使用pandas导入csv文件内容的示例代码
Dec 24 #Python
python如何利用cv2.rectangle()绘制矩形框
Dec 24 #Python
Python中np.random.randint()参数详解及用法实例
Sep 23 #Python
Python中tqdm的使用和例子
Sep 23 #Python
python 镜像环境搭建总结
Sep 23 #Python
Python创建SQL数据库流程逐步讲解
Sep 23 #Python
Python爬取奶茶店数据分析哪家最好喝以及性价比
Sep 23 #Python
You might like
两个强悍的php 图像处理类1
2009/06/15 PHP
PHP源码之explode使用说明
2011/08/05 PHP
PHP无限分类(树形类)的深入分析
2013/06/02 PHP
PHP支付系统设计与典型案例分享
2016/08/02 PHP
MAC下通过改apache配置文件切换php多版本的方法
2017/04/26 PHP
js中top、clientTop、scrollTop、offsetTop的区别 文字详细说明版
2011/01/08 Javascript
javascript针对DOM的应用分析(三)
2012/04/15 Javascript
angularjs创建弹出框实现拖动效果
2020/08/25 Javascript
利用JavaScript实现拖拽改变元素大小
2016/12/14 Javascript
JS实现改变HTML上文字颜色和内容的方法
2016/12/30 Javascript
jQuery简单实现MD5加密的方法
2017/03/03 Javascript
微信小程序访问node.js接口服务器搭建教程
2017/04/25 Javascript
vue如何在自定义组件中使用v-model
2018/05/14 Javascript
JavaScript引用类型Date常见用法实例分析
2018/08/08 Javascript
javascript中floor使用方法总结
2019/02/02 Javascript
webpack的 rquire.context用法实现工程自动化的方法
2020/02/07 Javascript
vue学习笔记之Vue中css动画原理简单示例
2020/02/29 Javascript
在Vuex中Mutations修改状态操作
2020/07/24 Javascript
Angular短信模板校验代码
2020/09/23 Javascript
Vue实现图书管理小案例
2020/12/03 Vue.js
Python编写屏幕截图程序方法
2015/02/18 Python
python中字典(Dictionary)用法实例详解
2015/05/30 Python
简单实现python数独游戏
2018/03/30 Python
Python自动发送邮件的方法实例总结
2018/12/08 Python
python 并发编程 非阻塞IO模型原理解析
2019/08/20 Python
pandas读取csv文件提示不存在的解决方法及原因分析
2020/04/21 Python
Django中FilePathField字段的用法
2020/05/21 Python
耐克美国官网:Nike.com
2016/08/01 全球购物
什么是Rollback Segment
2013/04/22 面试题
室内设计自我鉴定
2013/10/15 职场文书
青春奉献演讲稿
2014/05/08 职场文书
2015关于重阳节的演讲稿
2015/03/20 职场文书
公司辞职信模板
2015/05/13 职场文书
刑事上诉状范文
2015/05/22 职场文书
2015年中学总务处工作总结
2015/07/22 职场文书
基于python定位棋子位置及识别棋子颜色
2021/07/26 Python