pandas和spark dataframe互相转换实例详解


Posted in Python onFebruary 18, 2020

这篇文章主要介绍了pandas和spark dataframe互相转换实例详解,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下

from pyspark.sql import SparkSession
# 初始化spark会话
spark = SparkSession \
  .builder \
  .getOrCreate()
spark_df = spark.createDataFrame(pandas_df)

spark的dataframe转pandas的dataframe

import pandas as pd
pandas_df = spark_df.toPandas()

由于pandas的方式是单机版的,即toPandas()的方式是单机版的,所以参考breeze_lsw改成分布式版本:

import pandas as pd
def _map_to_pandas(rdds):
  return [pd.DataFrame(list(rdds))]
  
def topas(df, n_partitions=None):
  if n_partitions is not None: df = df.repartition(n_partitions)
  df_pand = df.rdd.mapPartitions(_map_to_pandas).collect()
  df_pand = pd.concat(df_pand)
  df_pand.columns = df.columns
  return df_pand
  
pandas_df = topas(spark_df)

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python中用函数作为返回值和实现闭包的教程
Apr 27 Python
Python中的choice()方法使用详解
May 15 Python
对Python捕获控制台输出流的方法详解
Jan 07 Python
Python+OpenCV感兴趣区域ROI提取方法
Jan 10 Python
Python txt文件加入字典并查询的方法
Jan 15 Python
python导入pandas具体步骤方法
Jun 23 Python
django 快速启动数据库客户端程序的方法示例
Aug 16 Python
python同时替换多个字符串方法示例
Sep 17 Python
Python matplotlib以日期为x轴作图代码实例
Nov 22 Python
Python接口测试get请求过程详解
Feb 28 Python
利用PyQt5+Matplotlib 绘制静态/动态图的实现代码
Jul 13 Python
Python爬虫基础之初次使用scrapy爬虫实例
Jun 26 Python
PyTorch中Tensor的数据统计示例
Feb 17 #Python
pytorch实现Tensor变量之间的转换
Feb 17 #Python
Macbook安装Python最新版本、GUI开发环境、图像处理、视频处理环境详解
Feb 17 #Python
PyCharm无法识别PyQt5的2种解决方法,ModuleNotFoundError: No module named 'pyqt5'
Feb 17 #Python
python识别验证码图片实例详解
Feb 17 #Python
Python pyautogui模块实现鼠标键盘自动化方法详解
Feb 17 #Python
Matplotlib使用字符串代替变量绘制散点图的方法
Feb 17 #Python
You might like
全国FM电台频率大全 - 22 重庆市
2020/03/11 无线电
PHP得到mssql的存储过程的输出参数功能实现
2012/11/23 PHP
thinkphp3.x中cookie方法的用法分析
2016/05/19 PHP
PHP使用数组实现矩阵数学运算的方法示例
2017/05/29 PHP
php empty 函数判断结果为空但实际值却为非空的原因解析
2018/05/28 PHP
在laravel中使用with实现动态添加where条件
2019/10/10 PHP
使用jquery实现select添加实现后台权限添加的效果
2011/05/28 Javascript
jquery ajax修改全局变量示例代码
2013/11/08 Javascript
深入理解JavaScript系列(25):设计模式之单例模式详解
2015/03/03 Javascript
jQuery实现可以控制图片旋转角度效果(附demo源码下载)
2016/01/27 Javascript
JS中使用FormData上传文件、图片的方法
2016/08/07 Javascript
jQuery 利用$.ajax 时获取原生XMLHttpRequest 对象的方法
2016/08/25 Javascript
JavaScript-html标题滚动效果的简单实现
2016/09/08 Javascript
将jquery.qqFace.js表情转换成微信的字符码
2017/12/01 jQuery
vue-cli常用设置总结
2018/02/24 Javascript
vue的安装及element组件的安装方法
2018/03/09 Javascript
Vuex实现计数器以及列表展示效果
2018/03/10 Javascript
浅谈webpack性能榨汁机(打包速度优化)
2019/01/09 Javascript
10种JavaScript最常见的错误(小结)
2019/06/21 Javascript
layui 关闭open弹出框 刷新table表格页面的方法
2019/09/16 Javascript
深入理解Antd-Select组件的用法
2020/02/25 Javascript
python抓取网页内容示例分享
2014/02/24 Python
Python读csv文件去掉一列后再写入新的文件实例
2017/12/28 Python
Python实现的爬取网易动态评论操作示例
2018/06/06 Python
libreoffice python 操作word及excel文档的方法
2019/07/04 Python
对python中的float除法和整除法的实例详解
2019/07/20 Python
基于python进行抽样分布描述及实践详解
2019/09/02 Python
详解python中的三种命令行模块(sys.argv,argparse,click)
2020/12/15 Python
轻化专业学生实习自我鉴定
2013/09/20 职场文书
自我鉴定范文200字
2013/10/02 职场文书
2013年高中生自我评价
2013/10/23 职场文书
心碎乌托邦的创业计划书范文
2013/12/26 职场文书
助残日活动总结
2014/08/27 职场文书
毕业证委托书范文
2014/09/26 职场文书
设立有限责任公司出资协议书
2014/11/01 职场文书
高质量“欢迎词”
2019/04/03 职场文书