python:pandas合并csv文件的方法(图书数据集成)


Posted in Python onApril 12, 2018

数据集成:将不同表的数据通过主键进行连接起来,方便对数据进行整体的分析。

两张表:ReaderInformation.csv,ReaderRentRecode.csv

ReaderInformation.csv:

python:pandas合并csv文件的方法(图书数据集成)

ReaderRentRecode.csv:

python:pandas合并csv文件的方法(图书数据集成)

pandas读取csv文件,并进行csv文件合并处理:

# -*- coding:utf-8 -*-
import csv as csv
import numpy as np
# -------------
# csv读取表格数据
# -------------
'''
csv_file_object = csv.reader(codecs.open('ReaderRentRecode.csv', 'rb'))
header = csv_file_object.next()
print header
print type(header)
print header[1]
data = []
for row in csv_file_object:
  data.append(row)
data = np.array(data)
print data[0::, 0]
'''
# -------------
# pandas读取表格数据
# -------------
import pandas as pd
df = pd.read_csv('ReaderRentRecode.csv') # 读者借阅信息表
'''
print df.head()
print '----------------'
print df[['读者证号', '读者姓名', '书名', '中图法分类号']] # 选取其中的四列
print '------------------------------------------------------------------'
print
'''
dd = pd.read_csv('ReaderInformation.csv')
'''
print dd.head()
print '----------------'
print dd[['读者证号', '读者性别', '读者单位', '读者类别']]
print '------------------------------------------------------------------'
print
'''
data = pd.merge(df, dd, on=['读者证号', '读者姓名'], how='left') # pandas csv表左连接
data = data[['读者证号', '读者姓名', '读者性别', '书名', '中图法分类号', '读者单位', '读者类别']]
print data
print '------------------------------------------------------------------'
print
# -------------
# pandas写入表格数据
# -------------
data.to_csv(r'data.csv', encoding='gbk')

合并后的csv文件:data.csv

python:pandas合并csv文件的方法(图书数据集成)

通过使用pandas的函数merge来进行两个表的左连接,最后得到相应的data.csv文件。

以上这篇python:pandas合并csv文件的方法(图书数据集成)就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
详解Python的Django框架中的模版相关知识
Jul 15 Python
简单学习Python多进程Multiprocessing
Aug 29 Python
Python cookbook(数据结构与算法)让字典保持有序的方法
Feb 18 Python
详谈pandas中agg函数和apply函数的区别
Apr 20 Python
用Django写天气预报查询网站
Oct 21 Python
pytorch 转换矩阵的维数位置方法
Dec 08 Python
Python实现去除列表中重复元素的方法总结【7种方法】
Feb 16 Python
python+mysql实现学生信息查询系统
Feb 21 Python
Python获取数据库数据并保存在excel表格中的方法
Jun 12 Python
Pytorch释放显存占用方式
Jan 13 Python
Python开发之QT解决无边框界面拖动卡屏问题(附带源码)
May 27 Python
django中websocket的具体使用
Jan 22 Python
用pandas按列合并两个文件的实例
Apr 12 #Python
Python中多个数组行合并及列合并的方法总结
Apr 12 #Python
Python实现的凯撒密码算法示例
Apr 12 #Python
python merge、concat合并数据集的实例讲解
Apr 12 #Python
Python实现的维尼吉亚密码算法示例
Apr 12 #Python
python pandas dataframe 按列或者按行合并的方法
Apr 12 #Python
python监控进程脚本
Apr 12 #Python
You might like
一个程序下载的管理程序(三)
2006/10/09 PHP
用Php实现链结人气统计
2006/10/09 PHP
PHP中使用substr()截取字符串出现中文乱码问题该怎么办
2015/10/21 PHP
URL地址中的#符号使用说明
2011/02/12 Javascript
利用了jquery的ajax实现二级联互动菜单
2013/12/02 Javascript
jQuery中unwrap()方法用法实例
2015/01/16 Javascript
AngularJS中的模块详解
2015/01/29 Javascript
跟我学习javascript的基本类型和引用类型
2015/11/16 Javascript
学习javascript面向对象 javascript实现继承的方式
2016/01/04 Javascript
JavaScript数据推送Comet技术详解
2016/04/07 Javascript
JS基于MSClass和setInterval实现ajax定时采集信息并滚动显示的方法
2016/04/18 Javascript
总结Javascript中的隐式类型转换
2016/08/24 Javascript
如何安装控制器JavaScript生成插件详解
2018/10/21 Javascript
Mint UI实现A-Z字母排序的城市选择列表
2018/12/28 Javascript
浅谈redux, koa, express 中间件实现对比解析
2019/05/23 Javascript
[36:33]完美世界DOTA2联赛PWL S2 LBZS vs Forest 第二场 11.29
2020/12/02 DOTA
python调用fortran模块
2016/04/08 Python
Python 实现简单的shell sed替换功能(实例讲解)
2017/09/29 Python
对python 矩阵转置transpose的实例讲解
2018/04/17 Python
python机器学习之KNN分类算法
2018/08/29 Python
Python类如何定义私有变量
2020/02/03 Python
美国礼品卡交易网站:Cardpool
2018/08/27 全球购物
西班牙土拨鼠床垫公司,感觉在云端:Marmota
2019/03/18 全球购物
POS解决方案:MUNBYN(热敏打印机、条形码扫描仪)
2020/06/09 全球购物
函数只定义了一次, 调用了一次, 但编译器提示非法重定义了-什么问题?
2014/10/03 面试题
2014年庆元旦活动方案
2014/02/15 职场文书
英语老师推荐信
2014/02/26 职场文书
倡议书格式
2014/04/14 职场文书
学校四风问题对照检查材料思想汇报
2014/09/26 职场文书
学校党支部公开承诺书
2015/04/30 职场文书
天鹅湖观后感
2015/06/09 职场文书
欠条样本
2015/07/03 职场文书
教师节祝酒词
2015/08/11 职场文书
学校少先队工作总结
2015/08/12 职场文书
2019假期福利管理制度!
2019/07/15 职场文书
python 通过使用Yolact训练数据集
2021/04/06 Python