pyspark.sql.DataFrame与pandas.DataFrame之间的相互转换实例


Posted in Python onAugust 02, 2018

代码如下,步骤流程在代码注释中可见:

# -*- coding: utf-8 -*-
import pandas as pd
from pyspark.sql import SparkSession
from pyspark.sql import SQLContext
from pyspark import SparkContext
 
#初始化数据
 
#初始化pandas DataFrame
df = pd.DataFrame([[1, 2, 3], [4, 5, 6]], index=['row1', 'row2'], columns=['c1', 'c2', 'c3'])
 
#打印数据
print df
 
#初始化spark DataFrame
sc = SparkContext()
if __name__ == "__main__":
 spark = SparkSession\
  .builder\
  .appName("testDataFrame")\
  .getOrCreate()
 
sentenceData = spark.createDataFrame([
 (0.0, "I like Spark"),
 (1.0, "Pandas is useful"),
 (2.0, "They are coded by Python ")
], ["label", "sentence"])
 
#显示数据
sentenceData.select("label").show()
 
#spark.DataFrame 转换成 pandas.DataFrame
sqlContest = SQLContext(sc)
spark_df = sqlContest.createDataFrame(df)
 
#显示数据
spark_df.select("c1").show()
 
 
# pandas.DataFrame 转换成 spark.DataFrame
pandas_df = sentenceData.toPandas()
 
#打印数据
print pandas_df

程序结果:

pyspark.sql.DataFrame与pandas.DataFrame之间的相互转换实例

以上这篇pyspark.sql.DataFrame与pandas.DataFrame之间的相互转换实例就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
跟老齐学Python之传说中的函数编写条规
Oct 11 Python
详细解析Python中__init__()方法的高级应用
May 11 Python
Python压缩解压缩zip文件及破解zip文件密码的方法
Nov 04 Python
Python用61行代码实现图片像素化的示例代码
Dec 10 Python
Puppeteer使用示例详解
Jun 20 Python
python使用递归的方式建立二叉树
Jul 03 Python
详解Python time库的使用
Oct 10 Python
python+opencv实现车牌定位功能(实例代码)
Dec 24 Python
Python tkinter制作单机五子棋游戏
Sep 14 Python
python实现磁盘日志清理的示例
Nov 05 Python
Python request post上传文件常见要点
Nov 20 Python
Python中requests库的用法详解
Jun 05 Python
Python实现两个list求交集,并集,差集的方法示例
Aug 02 #Python
python爬虫框架scrapy实现模拟登录操作示例
Aug 02 #Python
python爬虫之线程池和进程池功能与用法详解
Aug 02 #Python
Python列表推导式与生成器用法分析
Aug 02 #Python
python flask实现分页的示例代码
Aug 02 #Python
Django分页查询并返回jsons数据(中文乱码解决方法)
Aug 02 #Python
Python实现正整数分解质因数操作示例
Aug 01 #Python
You might like
用Flash图形化数据(二)
2006/10/09 PHP
PHP 小心urldecode引发的SQL注入漏洞
2011/10/27 PHP
PHP cdata 处理(详细介绍)
2013/07/05 PHP
php文件上传的例子及参数详解
2013/12/12 PHP
一个PHP针对数字的加密解密类
2014/03/20 PHP
php超快高效率统计大文件行数
2015/07/05 PHP
浅谈Yii乐观锁的使用及原理
2017/07/25 PHP
PHP常见数组排序方法小结
2018/08/20 PHP
6个常见的 PHP 安全性攻击实例和阻止方法
2020/12/16 PHP
二级域名转向类
2006/11/09 Javascript
通过JS 获取Mouse Position(鼠标坐标)的代码
2009/09/21 Javascript
IE6 弹出Iframe层中的文本框“经常”无法获得输入焦点
2009/12/27 Javascript
javascript动态添加删除tabs标签的方法
2015/07/06 Javascript
jQuery+Pdo编写login登陆界面
2016/08/01 Javascript
js模仿微信朋友圈计算时间显示几天/几小时/几分钟/几秒之前
2017/04/27 Javascript
详解Windows下安装Nodejs步骤
2017/05/18 NodeJs
JavaScript实现简单的文本逐字打印效果示例
2018/04/12 Javascript
微信小程序返回箭头跳转到指定页面实例解析
2019/10/08 Javascript
[33:17]OG vs VGJ.T 2018国际邀请赛小组赛BO2 第二场 8.18
2018/08/19 DOTA
Python+Django在windows下的开发环境配置图解
2009/11/11 Python
python字符串替换示例
2014/04/24 Python
tensorflow中next_batch的具体使用
2018/02/02 Python
CentOS7下python3.7.0安装教程
2018/07/30 Python
Python使用pickle模块报错EOFError Ran out of input的解决方法
2018/08/16 Python
Python File(文件) 方法整理
2019/02/18 Python
pytorch 实现在预训练模型的 input上增减通道
2020/01/06 Python
python中time tzset()函数实例用法
2021/02/18 Python
JAVA程序员面试题
2012/10/03 面试题
通息工程毕业生自荐信
2013/10/16 职场文书
寒假思想汇报
2014/01/10 职场文书
公司门卫管理制度
2014/02/01 职场文书
小学一年级学生评语
2014/04/22 职场文书
医学检验专业自荐信
2014/09/18 职场文书
三行辞职书范文
2015/02/26 职场文书
JavaScript canvas实现流星特效
2021/05/20 Javascript
Python中seaborn库之countplot的数据可视化使用
2021/06/11 Python