pyspark.sql.DataFrame与pandas.DataFrame之间的相互转换实例


Posted in Python onAugust 02, 2018

代码如下,步骤流程在代码注释中可见:

# -*- coding: utf-8 -*-
import pandas as pd
from pyspark.sql import SparkSession
from pyspark.sql import SQLContext
from pyspark import SparkContext
 
#初始化数据
 
#初始化pandas DataFrame
df = pd.DataFrame([[1, 2, 3], [4, 5, 6]], index=['row1', 'row2'], columns=['c1', 'c2', 'c3'])
 
#打印数据
print df
 
#初始化spark DataFrame
sc = SparkContext()
if __name__ == "__main__":
 spark = SparkSession\
  .builder\
  .appName("testDataFrame")\
  .getOrCreate()
 
sentenceData = spark.createDataFrame([
 (0.0, "I like Spark"),
 (1.0, "Pandas is useful"),
 (2.0, "They are coded by Python ")
], ["label", "sentence"])
 
#显示数据
sentenceData.select("label").show()
 
#spark.DataFrame 转换成 pandas.DataFrame
sqlContest = SQLContext(sc)
spark_df = sqlContest.createDataFrame(df)
 
#显示数据
spark_df.select("c1").show()
 
 
# pandas.DataFrame 转换成 spark.DataFrame
pandas_df = sentenceData.toPandas()
 
#打印数据
print pandas_df

程序结果:

pyspark.sql.DataFrame与pandas.DataFrame之间的相互转换实例

以上这篇pyspark.sql.DataFrame与pandas.DataFrame之间的相互转换实例就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python列表和元组的定义与使用操作示例
Jul 26 Python
Python编程求质数实例代码
Jan 31 Python
利用python库在局域网内传输文件的方法
Jun 04 Python
使用sklearn进行对数据标准化、归一化以及将数据还原的方法
Jul 11 Python
python开发之anaconda以及win7下安装gensim的方法
Jul 05 Python
利用Python检测URL状态
Jul 31 Python
python编写猜数字小游戏
Oct 06 Python
Python基础之字典常见操作经典实例详解
Feb 26 Python
python游戏开发的五个案例分享
Mar 09 Python
VSCode配合pipenv搞定虚拟环境的实现方法
May 17 Python
python能在浏览器能运行吗
Jun 17 Python
Python如何让字典保持有序排列
Apr 29 Python
Python实现两个list求交集,并集,差集的方法示例
Aug 02 #Python
python爬虫框架scrapy实现模拟登录操作示例
Aug 02 #Python
python爬虫之线程池和进程池功能与用法详解
Aug 02 #Python
Python列表推导式与生成器用法分析
Aug 02 #Python
python flask实现分页的示例代码
Aug 02 #Python
Django分页查询并返回jsons数据(中文乱码解决方法)
Aug 02 #Python
Python实现正整数分解质因数操作示例
Aug 01 #Python
You might like
php 实现进制转换(二进制、八进制、十六进制)互相转换实现代码
2010/10/22 PHP
php实现图片缩放功能类
2013/12/18 PHP
PHP使用DirectoryIterator显示下拉文件列表的方法
2015/03/13 PHP
php创建多级目录与级联删除文件的方法示例
2019/09/12 PHP
php使用Swoole实现毫秒级定时任务的方法
2020/09/04 PHP
php redis setnx分布式锁简单原理解析
2020/10/23 PHP
js中的string.format函数代码
2020/08/11 Javascript
NodeJS的模块写法入门(实例代码)
2012/03/07 NodeJs
Js放到HTML文件中的哪个位置有什么区别
2013/08/21 Javascript
jQuery把表单元素变为json对象
2013/11/06 Javascript
鼠标选择动态改变网页背景颜色的JS代码
2013/12/10 Javascript
javascript批量修改文件编码格式的方法
2015/01/27 Javascript
JS模式之简单的订阅者和发布者模式完整实例
2015/06/30 Javascript
JavaScript中日期的相关操作方法总结
2015/10/24 Javascript
js实现获取两个日期之间所有日期的方法
2016/06/17 Javascript
jQuery validate 验证radio实例
2017/03/01 Javascript
微信小程序实现文字跑马灯效果
2020/05/26 Javascript
网页爬虫之cookie自动获取及过期自动更新的实现方法
2018/03/06 Javascript
webstorm中配置Eslint的两种方式及差异比较详解
2018/10/19 Javascript
vue增加强缓存和版本号的实现方法
2019/05/01 Javascript
使用vue for时为什么要key【推荐】
2019/07/11 Javascript
原生js实现的移动端可拖动进度条插件功能详解
2019/08/15 Javascript
解决vue的过渡动画无法正常实现问题
2019/10/31 Javascript
ES6函数实现排它两种写法解析
2020/05/13 Javascript
js实现鼠标拖曳效果
2020/12/30 Javascript
python使用三角迭代计算圆周率PI的方法
2015/03/20 Python
python实现感知器
2017/12/19 Python
Tensorflow卷积神经网络实例进阶
2018/05/24 Python
Python 实现Serial 与STM32J进行串口通讯
2019/12/18 Python
美国知名的女性服饰品牌:LOFT(洛芙特)
2016/08/05 全球购物
Kate Spade美国官网:纽约新兴时尚品牌,以包包闻名于世
2017/11/09 全球购物
《祁黄羊》教学反思
2014/04/22 职场文书
入团介绍人意见范文
2015/06/04 职场文书
浅析Redis Sentinel 与 Redis Cluster
2021/06/24 Redis
一文弄懂MySQL索引创建原则
2022/02/28 MySQL
mybatis-plus模糊查询指定字段
2022/04/28 Java/Android