pandas和spark dataframe互相转换实例详解


Posted in Python onFebruary 18, 2020

这篇文章主要介绍了pandas和spark dataframe互相转换实例详解,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下

from pyspark.sql import SparkSession
# 初始化spark会话
spark = SparkSession \
  .builder \
  .getOrCreate()
spark_df = spark.createDataFrame(pandas_df)

spark的dataframe转pandas的dataframe

import pandas as pd
pandas_df = spark_df.toPandas()

由于pandas的方式是单机版的,即toPandas()的方式是单机版的,所以参考breeze_lsw改成分布式版本:

import pandas as pd
def _map_to_pandas(rdds):
  return [pd.DataFrame(list(rdds))]
  
def topas(df, n_partitions=None):
  if n_partitions is not None: df = df.repartition(n_partitions)
  df_pand = df.rdd.mapPartitions(_map_to_pandas).collect()
  df_pand = pd.concat(df_pand)
  df_pand.columns = df.columns
  return df_pand
  
pandas_df = topas(spark_df)

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python使用multiprocessing模块实现带回调函数的异步调用方法
Apr 18 Python
使用python实现生成用户信息
Mar 20 Python
Python+matplotlib实现填充螺旋实例
Jan 15 Python
解决Python正则表达式匹配反斜杠''\''问题
Jul 17 Python
python 判断三个数字中的最大值实例代码
Jul 24 Python
Python Subprocess模块原理及实例
Aug 26 Python
python每5分钟从kafka中提取数据的例子
Dec 23 Python
pytorch实现Tensor变量之间的转换
Feb 17 Python
python3 正则表达式基础廖雪峰
Mar 25 Python
基于python实现音乐播放器代码实例
Jul 01 Python
在终端启动Python时报错的解决方案
Nov 20 Python
Python socket如何解析HTTP请求内容
Feb 12 Python
PyTorch中Tensor的数据统计示例
Feb 17 #Python
pytorch实现Tensor变量之间的转换
Feb 17 #Python
Macbook安装Python最新版本、GUI开发环境、图像处理、视频处理环境详解
Feb 17 #Python
PyCharm无法识别PyQt5的2种解决方法,ModuleNotFoundError: No module named 'pyqt5'
Feb 17 #Python
python识别验证码图片实例详解
Feb 17 #Python
Python pyautogui模块实现鼠标键盘自动化方法详解
Feb 17 #Python
Matplotlib使用字符串代替变量绘制散点图的方法
Feb 17 #Python
You might like
浅析php学习的路线图
2013/07/10 PHP
php正则表达式基本知识与应用详解【经典教程】
2017/04/17 PHP
CI框架附属类用法分析
2018/12/26 PHP
javascript中的startWith和endWith的几种实现方法
2013/05/07 Javascript
浅谈javascript:两种注释,声明变量,定义函数
2016/10/05 Javascript
js html css实现复选框全选与反选
2016/10/09 Javascript
canvas绘制表盘时钟
2017/01/23 Javascript
jQuery+C#实现参数RSA加密传输功能【附jsencrypt.js下载】
2017/06/26 jQuery
Angular6中使用Swiper的方法示例
2018/07/09 Javascript
Bootstrap4 gulp 配置详解
2019/01/06 Javascript
微信小程序实现的自定义分享功能示例
2019/02/12 Javascript
jquery实现吸顶导航效果
2020/01/08 jQuery
[02:23]DOTA2英雄基础教程 幻影长矛手
2013/12/09 DOTA
Python中的startswith和endswith函数使用实例
2014/08/25 Python
Python遍历文件夹和读写文件的实现代码
2016/08/28 Python
python中os和sys模块的区别与常用方法总结
2017/11/14 Python
使用Python的package机制如何简化utils包设计详解
2017/12/11 Python
Python基于socket实现简单的即时通讯功能示例
2018/01/16 Python
linux下python使用sendmail发送邮件
2018/05/22 Python
Python3分析处理声音数据的例子
2019/08/27 Python
浅谈pycharm使用及设置方法
2019/09/09 Python
pytorch 求网络模型参数实例
2019/12/30 Python
python读取多层嵌套文件夹中的文件实例
2020/02/27 Python
pycharm 实现本地写代码,服务器运行的操作
2020/06/08 Python
Python如何重新加载模块
2020/07/29 Python
什么是CSS3 HSLA色彩模式?HSLA模拟渐变色条
2016/04/26 HTML / CSS
Foot Locker加拿大官网:美国知名运动产品零售商
2019/07/21 全球购物
是否可以从一个static方法内部发出对非static方法的调用?
2014/08/18 面试题
幼儿园老师寄语
2014/04/03 职场文书
大学生活动总结模板
2014/07/02 职场文书
2014年教育实习工作总结
2014/11/22 职场文书
医院中层管理人员培训心得体会
2016/01/11 职场文书
关于公司年会的开幕词
2016/03/04 职场文书
PySwarms(Python粒子群优化工具包)的使用:GlobalBestPSO例子解析
2021/04/05 Python
python编写五子棋游戏
2021/05/25 Python
Java 数组内置函数toArray详解
2021/06/28 Java/Android