python 使用pandas读取csv文件的方法


Posted in Python onDecember 24, 2022

在这里记录一下,python使用pandas读取文件的方法
用到pandas库的read_csv函数

# -*- coding: utf-8 -*-
"""
Created on Mon Jan 24 16:48:32 2022

@author: zxy
"""

# 导入包
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import matplotlib.gridspec as gridspec
import seaborn as sns; plt.style.use('ggplot')

import sklearn
from sklearn.preprocessing import StandardScaler
from sklearn.model_selection import train_test_split
from sklearn.utils import shuffle
from sklearn.metrics import confusion_matrix
from sklearn.manifold import TSNE

# 导入并查看数据
crecreditcard_data=pd.read_csv('./creditcard.csv')
crecreditcard_data.shape,crecreditcard_data.info()

crecreditcard_data.describe()


crecreditcard_data.head()

# 看看欺诈与非欺诈的比例如何
count_classes=pd.value_counts(crecreditcard_data['Class'],sort=True).sort_index()

# 统计下具体数据
count_classes.value_counts()
# 也可以用count_classes[0],count_classes[1]看分别数据

count_classes.plot(kind='bar')
plt.show()

知识点扩展:

pandas读取csv文件的操作

1. 读取csv文件

import pandas as pd
import numpy as np
 
# 读取整个csv文件
csv_data = pd.read_csv("./stock_day.csv")
 
# 读取指定列索引字段的数据
csv_data = pd.read_csv("./stock_day.csv", usecols=['open', 'close'])
 
# 将我们修改完的csv的文件保存到新的路径下
csv_data.to_csv('demo.csv')

观察我们保存的文件的格式(行索引为我们的日期, 列索引为 open close) :

python 使用pandas读取csv文件的方法

# 查看新保存的文件
new_data = read_csv('./demo.csv')

观察新保存的文件(我们在读取的时候默认给我们添加了新的行索引, 及Unnamed:0): 

python 使用pandas读取csv文件的方法

使用to_csv的时候, 我们可以给他传入几个参数:

csv_data.to_csv('demo.csv', header=True, index=False)

 

python 使用pandas读取csv文件的方法

to_csv这个方法中可以传递一些参数:

 DataFrame.to_csv(path_or_buf=None, sep=', ’, columns=None, header=True, index=True, index_label=None, mode='w', encoding=None)

  • path_or_buf :文件保存的路径;
  • sep :默认是以 , 进行分割 , 也可以自己制定;
  • columns : 保存索引列和指定列;
  • index:是否写进行索引 0或者1;
  • header :boolean or list of string, default True,是否写进列索引值 0或者 1;
  • na_rep=NaN: 缺失值保存为Na 如果不写 默认为空;
  • float_format='%.2f' :保留两位小数;

再来回顾一下将我们的行索引装成日期格式的方法:

# 生成一个时间的序列,略过周末非交易日
date = pd.date_range('2018-02-27', periods=new_data.shape[1], freq='B')
 
# index代表行索引,columns代表列索引
new_data = pd.DataFrame(new_data, index=date)

到此这篇关于python 使用pandas读取csv文件的方法的文章就介绍到这了,更多相关python 读取csv文件内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
python创建关联数组(字典)的方法
May 04 Python
python3.4控制用户输入与输出的方法
Oct 17 Python
python实现文本界面网络聊天室
Dec 12 Python
Python3字符串encode与decode的讲解
Apr 02 Python
基于python实现百度翻译功能
May 09 Python
Python多进程方式抓取基金网站内容的方法分析
Jun 03 Python
python plotly画柱状图代码实例
Dec 13 Python
pytorch 实现打印模型的参数值
Dec 30 Python
pytorch 修改预训练model实例
Jan 18 Python
Python 动态变量名定义与调用方法
Feb 09 Python
浅谈Python中的函数(def)及参数传递操作
May 25 Python
Python中Schedule模块使用详解 周期任务神器
Apr 19 Python
Python使用pandas导入csv文件内容的示例代码
Dec 24 #Python
python如何利用cv2.rectangle()绘制矩形框
Dec 24 #Python
Python中np.random.randint()参数详解及用法实例
Sep 23 #Python
Python中tqdm的使用和例子
Sep 23 #Python
python 镜像环境搭建总结
Sep 23 #Python
Python创建SQL数据库流程逐步讲解
Sep 23 #Python
Python爬取奶茶店数据分析哪家最好喝以及性价比
Sep 23 #Python
You might like
php学习之function的用法
2012/07/14 PHP
解析crontab php自动运行的方法
2013/06/24 PHP
微信营销平台系统?刮刮乐的开发
2014/06/10 PHP
json 定义
2008/06/10 Javascript
jquery CSS选择器笔记
2010/03/29 Javascript
在浏览器窗口上添加遮罩层的方法
2012/11/12 Javascript
100个不能错过的实用JS自定义函数
2014/03/05 Javascript
JS中判断null、undefined与NaN的方法
2014/03/26 Javascript
jquery 中的each()跳出循环的语句
2014/05/23 Javascript
Thinkphp模板没有解析直接原样输出的解决方法
2014/10/31 Javascript
javascript面向对象程序设计(一)
2015/01/29 Javascript
node.js实现博客小爬虫的实例代码
2016/10/08 Javascript
Angular2学习笔记——详解路由器模型(Router)
2016/12/02 Javascript
基于Node.js模板引擎教程-jade速学与实战1
2017/09/17 Javascript
[01:21:58]守擂赛DOTA2第一周决赛
2020/04/22 DOTA
Python 命令行非阻塞输入的小例子
2013/09/27 Python
Python实现一个简单的MySQL类
2015/01/07 Python
Python抽象和自定义类定义与用法示例
2018/08/23 Python
在Python中分别打印列表中的每一个元素方法
2018/11/07 Python
python全栈要学什么 python全栈学习路线
2019/06/28 Python
Python  Django 母版和继承解析
2019/08/09 Python
python实现的登录与提交表单数据功能示例
2019/09/25 Python
python Django框架实现web端分页呈现数据
2019/10/31 Python
python 比较2张图片的相似度的方法示例
2019/12/18 Python
css3实现input输入框颜色渐变发光效果代码
2014/04/02 HTML / CSS
CSS3实现酷炫的3D旋转透视效果
2019/11/21 HTML / CSS
萌新HTML5 入门指南(二)
2020/11/09 HTML / CSS
数据库测试通常都包括哪些方面
2015/11/30 面试题
介绍一下RMI的基本概念
2016/12/17 面试题
大四自我鉴定
2014/02/08 职场文书
巴西世界杯32强口号
2014/06/05 职场文书
上课迟到检讨书300字
2014/10/15 职场文书
2014年教师业务工作总结
2014/12/19 职场文书
委托书格式要求
2015/01/28 职场文书
女性励志书籍推荐
2019/08/19 职场文书
Python中可变和不可变对象的深入讲解
2021/08/02 Python