使用pandas对两个dataframe进行join的实例


Posted in Python onJune 08, 2018

需求:

两个文件,一个文件为统计报表,里面含有手机号,另一个文件为手机号段归属地,含有手机号码前七位对应的地区。需要对统计报表进行处理,将手机号所在的归属地加入到统计报表中,使用pandas提供的join功能来实现,代码如下:

#coding=utf-8
from pandas import Series,DataFrame
import pandas as pd
#reader1 = pd.read_csv('Dm_Mobile.txt',iterator=True,encoding="gb2312")
#df1 = reader1.get_chunk(10)
#reader2 = pd.read_csv('201604.csv',iterator=True,encoding="gb2312")
#df2 = reader.get_chunk(10)

#读取两个csv文件,生成dataframe
df1 = pd.read_csv('Dm_Mobile.csv',encoding="gb2312")
df2 = pd.read_csv('201604.csv',encoding="gb2312")

#截取手机号前七位,作为新列添加到dataframe
df2['p7s'] = Series([str(x)[:7] for x in Series(df2[u'手机号'])])
df2['p7i'] = df2['p7s'].astype("int64")

#在两个dataframe的手机前七位列上创建索引
index_df1 = df1.set_index('MobileNumber')
index_df2 = df2.set_index(['p7i'])

#以手机号前七位列为join列,对两个dataframe进行join
result = pd.concat([index_df1, index_df2], axis=1, join='inner')

#选取需要显示的列,重新生成result
result = result.reindex(columns=[u'积分商城订单号', u'手机号',u'产品编码',u'商品名称',u'商品价格',u'数量',u'虚拟码',u'消费时间',u'时间',u'兑换渠道商',u'MobileArea'])

#写入到excel文件中
writer = pd.ExcelWriter('pandas_simple.xlsx')
result.to_excel(writer, sheet_name=u'设计院',index=False)
writer.save()

以上这篇使用pandas对两个dataframe进行join的实例就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
全面了解python字符串和字典
Jul 07 Python
python使用邻接矩阵构造图代码示例
Nov 10 Python
python爬取m3u8连接的视频
Feb 28 Python
django使用LDAP验证的方法示例
Dec 10 Python
python实现文本界面网络聊天室
Dec 12 Python
linux查找当前python解释器的位置方法
Feb 20 Python
Python实现账号密码输错三次即锁定功能简单示例
Mar 29 Python
djano一对一、多对多、分页实例代码
Aug 16 Python
Python Web框架之Django框架文件上传功能详解
Aug 16 Python
Django REST框架创建一个简单的Api实例讲解
Nov 05 Python
python GUI库图形界面开发之PyQt5中QWebEngineView内嵌网页与Python的数据交互传参详细方法实例
Feb 26 Python
在python中使用pymysql往mysql数据库中插入(insert)数据实例
Mar 02 Python
pandas带有重复索引操作方法
Jun 08 #Python
使用python爬取B站千万级数据
Jun 08 #Python
pandas表连接 索引上的合并方法
Jun 08 #Python
详谈Pandas中iloc和loc以及ix的区别
Jun 08 #Python
python实现人人自动回复、抢沙发功能
Jun 08 #Python
利用Python写一个爬妹子的爬虫
Jun 08 #Python
python os用法总结
Jun 08 #Python
You might like
php获取某个目录大小的代码
2008/09/10 PHP
php setcookie函数的参数说明及其用法
2014/04/20 PHP
微信营销平台系统?刮刮乐的开发
2014/06/10 PHP
详解使用php-cs-fixer格式化代码
2020/09/16 PHP
用JavaScript显示随机图像或引用
2009/04/21 Javascript
javascript Slip.js实现整屏滑动的手机网页
2015/11/25 Javascript
jquery遍历json对象集合详解
2016/05/18 Javascript
JavaScript编写带旋转+线条干扰的验证码脚本实例
2016/05/30 Javascript
js实现鼠标左右移动,图片也跟着移动效果
2017/01/25 Javascript
vue + socket.io实现一个简易聊天室示例代码
2017/03/06 Javascript
EasyUI Datebox 日期验证之开始日期小于结束时间
2017/05/19 Javascript
从零开始搭建一个react项目开发
2018/02/09 Javascript
axios 处理 302 状态码的解决方法
2018/04/10 Javascript
js实现九宫格布局效果
2020/05/28 Javascript
基于javascript canvas实现五子棋游戏
2020/07/08 Javascript
Python操作MongoDB数据库PyMongo库使用方法
2015/04/27 Python
Python递归遍历列表及输出的实现方法
2015/05/19 Python
Python中使用urllib2模块编写爬虫的简单上手示例
2016/01/20 Python
Python实现基本线性数据结构
2016/08/22 Python
利用python生成一个导出数据库的bat脚本文件的方法
2016/12/30 Python
python抓取文件夹的所有文件
2018/02/27 Python
Python3中详解fabfile的编写
2018/06/24 Python
python使用wxpy实现微信消息防撤回脚本
2019/04/29 Python
python调试神器PySnooper的使用
2019/07/03 Python
python实现宿舍管理系统
2019/11/22 Python
自定义Django Form中choicefield下拉菜单选取数据库内容实例
2020/03/13 Python
Python3创建Django项目的几种方法(3种)
2020/06/03 Python
Python实现像awk一样分割字符串
2020/09/15 Python
css3中less实现文字长阴影(long shadow)
2020/04/24 HTML / CSS
HTML5 Canvas实现文本对齐的方法总结
2016/03/24 HTML / CSS
西班牙创意礼品和小工具网上商店:Curiosite
2016/07/26 全球购物
英国男女豪华配饰和礼品网站:Black.co.uk
2020/02/28 全球购物
2014年作风建设心得体会
2014/10/22 职场文书
浅谈:电影《孔子》观后感(范文)
2019/10/14 职场文书
python中对列表的删除和添加方法详解
2022/02/24 Python
Java 超详细讲解hashCode方法
2022/04/07 Java/Android