pandas和spark dataframe互相转换实例详解


Posted in Python onFebruary 18, 2020

这篇文章主要介绍了pandas和spark dataframe互相转换实例详解,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下

from pyspark.sql import SparkSession
# 初始化spark会话
spark = SparkSession \
  .builder \
  .getOrCreate()
spark_df = spark.createDataFrame(pandas_df)

spark的dataframe转pandas的dataframe

import pandas as pd
pandas_df = spark_df.toPandas()

由于pandas的方式是单机版的,即toPandas()的方式是单机版的,所以参考breeze_lsw改成分布式版本:

import pandas as pd
def _map_to_pandas(rdds):
  return [pd.DataFrame(list(rdds))]
  
def topas(df, n_partitions=None):
  if n_partitions is not None: df = df.repartition(n_partitions)
  df_pand = df.rdd.mapPartitions(_map_to_pandas).collect()
  df_pand = pd.concat(df_pand)
  df_pand.columns = df.columns
  return df_pand
  
pandas_df = topas(spark_df)

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python获取从命令行输入数字的方法
Apr 29 Python
python魔法方法-属性转换和类的表示详解
Jul 22 Python
python 采集中文乱码问题的完美解决方法
Sep 27 Python
Python3 模块、包调用&路径详解
Oct 25 Python
完美解决在oj中Python的循环输入问题
Jun 25 Python
Python实现处理逆波兰表达式示例
Jul 30 Python
Pytorch to(device)用法
Jan 08 Python
Python 动态变量名定义与调用方法
Feb 09 Python
python实现FTP文件传输的方法(服务器端和客户端)
Mar 20 Python
如何理解python对象
Jun 21 Python
简单了解Python字典copy与赋值的区别
Sep 16 Python
Python调用高德API实现批量地址转经纬度并写入表格的功能
Jan 12 Python
PyTorch中Tensor的数据统计示例
Feb 17 #Python
pytorch实现Tensor变量之间的转换
Feb 17 #Python
Macbook安装Python最新版本、GUI开发环境、图像处理、视频处理环境详解
Feb 17 #Python
PyCharm无法识别PyQt5的2种解决方法,ModuleNotFoundError: No module named 'pyqt5'
Feb 17 #Python
python识别验证码图片实例详解
Feb 17 #Python
Python pyautogui模块实现鼠标键盘自动化方法详解
Feb 17 #Python
Matplotlib使用字符串代替变量绘制散点图的方法
Feb 17 #Python
You might like
re0第二季蕾姆被制作组打入冷宫!艾米莉亚女主扶正,原因唏嘘
2020/04/02 日漫
一个程序下载的管理程序(三)
2006/10/09 PHP
PHP动态页生成静态页的3种常用方法
2014/11/13 PHP
php将字符串随机分割成不同长度数组的方法
2015/06/01 PHP
php实现基于pdo的事务处理方法示例
2017/07/21 PHP
基于JQuery的访问WebService的代码(可访问Java[Xfire])
2010/11/19 Javascript
js中的string.format函数代码
2020/08/11 Javascript
jquery实现鼠标滑过后动态图片提示效果实例
2015/08/10 Javascript
jQuery实现带延迟效果的滑动菜单代码
2015/09/02 Javascript
jQuery实现移动端Tab选项卡效果
2017/03/15 Javascript
如何在AngularJs中调用第三方插件库
2017/05/21 Javascript
5分钟打造简易高效的webpack常用配置
2017/07/04 Javascript
JSON创建键值对(key是中文或者数字)方式详解
2017/08/24 Javascript
vue组件生命周期详解
2017/11/07 Javascript
利用angular、react和vue实现相同的面试题组件
2018/02/19 Javascript
JS中数组与对象的遍历方法实例小结
2018/08/14 Javascript
JavaScript实现刮刮乐效果
2020/11/01 Javascript
[01:08]DOTA2次级职业联赛 - Wings 战队宣传片
2014/12/01 DOTA
python创建和使用字典实例详解
2013/11/01 Python
python实现爬虫下载漫画示例
2014/02/16 Python
使用Python中PDB模块中的命令来调试Python代码的教程
2015/03/30 Python
python 统计列表中不同元素的数量方法
2018/06/29 Python
python实现读取excel文件中所有sheet操作示例
2019/08/09 Python
python实现密码强度校验
2020/03/18 Python
h5封装下拉刷新
2020/08/25 HTML / CSS
新加坡网上美容店:Hermo新加坡
2019/06/19 全球购物
总务岗位职责
2013/11/19 职场文书
考博专家推荐信模板
2013/12/02 职场文书
志愿者服务感言
2014/02/27 职场文书
材料工程专业毕业生求职信
2014/03/04 职场文书
竞选学委演讲稿
2014/09/13 职场文书
学校领导班子群众路线整改措施
2014/09/16 职场文书
2014年酒店前台工作总结
2014/11/14 职场文书
Nginx+Tomcat负载均衡集群的实现示例
2021/10/24 Servers
SpringBoot整合阿里云视频点播的过程详解
2021/12/06 Java/Android
Nginx工作模式及代理配置的使用细节
2022/03/21 Servers