使用pandas对两个dataframe进行join的实例


Posted in Python onJune 08, 2018

需求:

两个文件,一个文件为统计报表,里面含有手机号,另一个文件为手机号段归属地,含有手机号码前七位对应的地区。需要对统计报表进行处理,将手机号所在的归属地加入到统计报表中,使用pandas提供的join功能来实现,代码如下:

#coding=utf-8
from pandas import Series,DataFrame
import pandas as pd
#reader1 = pd.read_csv('Dm_Mobile.txt',iterator=True,encoding="gb2312")
#df1 = reader1.get_chunk(10)
#reader2 = pd.read_csv('201604.csv',iterator=True,encoding="gb2312")
#df2 = reader.get_chunk(10)

#读取两个csv文件,生成dataframe
df1 = pd.read_csv('Dm_Mobile.csv',encoding="gb2312")
df2 = pd.read_csv('201604.csv',encoding="gb2312")

#截取手机号前七位,作为新列添加到dataframe
df2['p7s'] = Series([str(x)[:7] for x in Series(df2[u'手机号'])])
df2['p7i'] = df2['p7s'].astype("int64")

#在两个dataframe的手机前七位列上创建索引
index_df1 = df1.set_index('MobileNumber')
index_df2 = df2.set_index(['p7i'])

#以手机号前七位列为join列,对两个dataframe进行join
result = pd.concat([index_df1, index_df2], axis=1, join='inner')

#选取需要显示的列,重新生成result
result = result.reindex(columns=[u'积分商城订单号', u'手机号',u'产品编码',u'商品名称',u'商品价格',u'数量',u'虚拟码',u'消费时间',u'时间',u'兑换渠道商',u'MobileArea'])

#写入到excel文件中
writer = pd.ExcelWriter('pandas_simple.xlsx')
result.to_excel(writer, sheet_name=u'设计院',index=False)
writer.save()

以上这篇使用pandas对两个dataframe进行join的实例就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
使用setup.py安装python包和卸载python包的方法
Nov 27 Python
理解python多线程(python多线程简明教程)
Jun 09 Python
Python设置Socket代理及实现远程摄像头控制的例子
Nov 13 Python
详解Python import方法引入模块的实例
Aug 02 Python
详解python里的命名规范
Jul 16 Python
python对验证码降噪的实现示例代码
Nov 12 Python
python使用opencv resize图像不进行插值的操作
Jul 05 Python
简单了解Django项目应用创建过程
Jul 06 Python
Python pymsql模块的使用
Sep 07 Python
教你使用Sublime text3搭建Python开发环境及常用插件安装另分享Sublime text3最新激活注册码
Nov 12 Python
python中str内置函数用法总结
Dec 27 Python
python pandas 解析(读取、写入)CSV 文件的操作方法
Dec 24 Python
pandas带有重复索引操作方法
Jun 08 #Python
使用python爬取B站千万级数据
Jun 08 #Python
pandas表连接 索引上的合并方法
Jun 08 #Python
详谈Pandas中iloc和loc以及ix的区别
Jun 08 #Python
python实现人人自动回复、抢沙发功能
Jun 08 #Python
利用Python写一个爬妹子的爬虫
Jun 08 #Python
python os用法总结
Jun 08 #Python
You might like
php 验证码实例代码
2010/06/01 PHP
php中实现记住密码自动登录的代码
2011/03/02 PHP
PHP8.0新功能之Match表达式的使用
2020/07/19 PHP
使用Mootools动态添加Css样式表代码,兼容各浏览器
2011/12/12 Javascript
js中escape对应的C#解码函数 UrlDecode
2012/12/16 Javascript
JavaScript获取鼠标移动时的坐标(兼容IE8、chome谷歌、Firefox)
2014/09/13 Javascript
JavaScript使用pop方法移除数组最后一个元素用法实例
2015/04/06 Javascript
jQuery隐藏和显示效果实现
2016/04/06 Javascript
简单学习vue指令directive
2016/11/03 Javascript
jQuery Mobile和HTML5开发App推广注册页
2016/11/07 Javascript
微信小程序入门教程
2016/11/18 Javascript
iOS + node.js使用Socket.IO框架进行实时通信示例
2017/04/14 Javascript
最通俗易懂的javascript变量提升详解
2017/08/05 Javascript
bootstrap自定义样式之bootstrap实现侧边导航栏功能
2018/09/10 Javascript
vue项目中使用scss的方法步骤
2019/05/16 Javascript
python正则表达式match和search用法实例
2015/03/26 Python
python中Matplotlib实现绘制3D图的示例代码
2017/09/04 Python
python matplotlib坐标轴设置的方法
2017/12/05 Python
详解tensorflow训练自己的数据集实现CNN图像分类
2018/02/07 Python
Pandas标记删除重复记录的方法
2018/04/08 Python
NumPy.npy与pandas DataFrame的实例讲解
2018/07/09 Python
浅谈Python中的全局锁(GIL)问题
2019/01/11 Python
python钉钉机器人运维脚本监控实例
2019/02/20 Python
详解Django3中直接添加Websockets方式
2020/02/12 Python
python3获取控制台输入的数据的具体实例
2020/08/16 Python
迪拜领先运动补剂零售品牌中文站:Sporter商城
2019/08/20 全球购物
单位门卫岗位职责
2013/12/20 职场文书
人力资源经理自我评价
2014/01/04 职场文书
军神教学反思
2014/02/04 职场文书
大专会计自我鉴定
2014/02/06 职场文书
国际贸易专业个人职业生涯规划
2014/02/15 职场文书
幼儿园安全责任书范本
2014/07/24 职场文书
实习单位证明范例
2014/11/17 职场文书
2016大学生社会实践心得体会范文
2016/01/14 职场文书
mysql事务对效率的影响分析总结
2021/10/24 MySQL
Python绘画好看的星空图
2022/03/17 Python