编程 Python

pandas处理csv文件的方法步骤

Posted in Python onOctober 16, 2020

一、我的需求

对于这样的一个 csv 表，需要将其
（1）将营业部名称和日期和股票代码进行拼接
（2）对于除了买入金额不同的的数据需要将它们的买入金额相加，每个买入金额乘以买卖序号的符号表示该营业名称对应的买入金额

比如：xx公司，20190731,1，股票1,4000，C20201010，xxxx
我这里想要的结果是：xx公司2019713C20201010,4000

pandas处理csv文件的方法步骤

二、代码

（1）首先由于文件是 gbk，所以读取是需要注意 encoding
（2）日期是int类型，所以需要转化为字符串

import pandas as pd
import numpy as np

#读取数据
filename = "test.csv"
# 读取 excel 表，根据文件的编码指定编码方式
data = pd.read_csv(filename, encoding='gbk')
# 将所有内容转为字符串
# data = data.applymap(str)
# 将日期这一列转为字符串
data['日期'] = data['日期'].apply(str)

# print(data.loc[0,'营业部名称'])
# print(data.loc[0,'日期'])
# print(data.loc[0,'股票代码'])
# print(data.loc[0,'买卖序号'])
# print(data.loc[0,'买入金额'])

# 拼接：营业部名称+日期+股票代码
data['name_date_code'] = data['营业部名称'] + data['日期'] + data['股票代码']
# 取"买卖序号"的符号和买入金额相乘
# np.sign 获取序号对应的符号
data['buy'] = np.sign(data['买卖序号']) * data['买入金额']
data = data.drop(['营业部名称', '日期', '买卖序号', '股票名', '买入金额', '股票代码', 'data_stock'], axis=1)

# 将 name_date_code 相同的行，金额相加
buy_sum = data.groupby('name_date_code')['buy'].sum()
# 将相加的金额加入数据data，缺失数据用0填充
data['buy_sum'] = data.loc[:, 'name_date_code'].map(buy_sum).fillna(0)
# 将买入金额删掉，只剩下两列数据
data = data.drop(['buy'], axis=1)
# 删除重复行
data = data.drop_duplicates()
# 写入数据，同样需要注意指定编码格式
data.to_csv("YYBD_result.csv", encoding='gbk',index=False)

三、总结

（1）编码格式，正常是 utf-8 的不用指定，用默认的即可

（2）pandas 读取一行数据

# data.iloc 取一整行
print(data.iloc[0])

（3）pandas 处理数据确实很厉害，字符串拼接，类型转换，删除重复行，真方便

到此这篇关于pandas处理csv文件的方法步骤的文章就介绍到这了,更多相关pandas处理csv文件内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木！

pandas处理csv文件的方法步骤

- Author -

南淮北安

声明：登载此文出于传递更多信息之目的，并不意味着赞同其观点或证实其描述。

Python 相关文章推荐

python多线程编程方式分析示例详解

Dec 06 Python

cmd运行python文件时对结果进行保存的方法

May 16 Python

python实现图片文件批量重命名

Mar 23 Python

pycharm 配置远程解释器的方法

Oct 28 Python

浅析python参数的知识点

Dec 10 Python

Python中的字符串切片（截取字符串）的详解

May 15 Python

Python识别快递条形码及Tesseract-OCR使用详解

Jul 15 Python

通过python连接Linux命令行代码实例

Feb 18 Python

Python新手如何进行闭包时绑定变量操作

May 29 Python

python numpy中multiply与*及matul 的区别说明

May 26 Python

Python排序算法之插入排序及其优化方案详解

Jun 11 Python

Python Pygame实战在打砖块游戏的实现

Mar 17 Python

python爬取”顶点小说网“《纯阳剑尊》的示例代码

Oct 16 #Python

Python使用内置函数setattr设置对象的属性值

Oct 16 #Python

python pymysql库的常用操作

Oct 16 #Python

Python基于callable函数检测对象是否可被调用

Oct 16 #Python

python collections模块的使用

Oct 16 #Python

python 如何使用find和find_all爬虫、找文本的实现

Oct 16 #Python

Django实现随机图形验证码的示例

Oct 15 #Python

You might like

Ping服务的php实现方法,让网站快速被收录

2012/02/04 PHP

PHP 文件系统详解

2012/09/13 PHP

php include类文件超时问题处理

2015/02/06 PHP

php如何获取文件的扩展名

2015/10/28 PHP

php实现用户注册密码的crypt加密

2017/06/08 PHP

PHP的PDO大对象(LOBs)

2019/01/27 PHP

checkbox选中与未选中判断示例

2014/08/04 Javascript

如何让你的Lightbox支持滚轮缩放及Base64图片

2014/12/04 Javascript

jQuery基于函数重载实现自定义Alert函数样式的方法

2016/07/27 Javascript

基于jQuery实现照片墙自动播放特效

2017/01/12 Javascript

jsonp跨域请求实现示例

2017/03/13 Javascript

vue-router之nuxt动态路由设置的两种方法小结

2018/09/26 Javascript

快速解决layui弹窗按enter键不停弹窗的问题

2019/09/18 Javascript

微信js-sdk 录音功能的示例代码

2019/11/01 Javascript

基于JQuery和DWR实现异步数据传递

2020/10/16 jQuery

python脚本实现统计日志文件中的ip访问次数代码分享

2014/08/06 Python

python登录豆瓣并发帖的方法

2015/07/08 Python

Python实现随机生成手机号及正则验证手机号的方法

2018/04/25 Python

pytorch 自定义数据集加载方法

2019/08/18 Python

Pytorch 数据加载与数据预处理方式

2019/12/31 Python

详解pycharm配置python解释器的问题

2020/10/15 Python

python requests库的使用

2021/01/06 Python

Python的轻量级ORM框架peewee使用教程

2021/02/05 Python

HTML5 Canvas自定义圆角矩形与虚线示例代码

2013/08/02 HTML / CSS

英国汽车零件购物网站：GSF Car Parts

2019/05/23 全球购物

小区门卫值班制度

2014/01/24 职场文书

财务简历的自我评价

2014/03/05 职场文书

大学生个人先进事迹材料范文

2014/05/03 职场文书

揭牌仪式策划方案

2014/05/28 职场文书

师范大学生求职信

2014/06/13 职场文书

与美同行演讲稿

2014/09/13 职场文书

2014年学校安全工作总结

2014/11/13 职场文书

教师个人事迹材料

2014/12/17 职场文书

企业年会祝酒词

2015/08/11 职场文书

校园广播稿范文

2015/08/19 职场文书

Golang 并发下的问题定位及解决方案

2022/03/16 Golang