pyspark.sql.DataFrame与pandas.DataFrame之间的相互转换实例


Posted in Python onAugust 02, 2018

代码如下,步骤流程在代码注释中可见:

# -*- coding: utf-8 -*-
import pandas as pd
from pyspark.sql import SparkSession
from pyspark.sql import SQLContext
from pyspark import SparkContext
 
#初始化数据
 
#初始化pandas DataFrame
df = pd.DataFrame([[1, 2, 3], [4, 5, 6]], index=['row1', 'row2'], columns=['c1', 'c2', 'c3'])
 
#打印数据
print df
 
#初始化spark DataFrame
sc = SparkContext()
if __name__ == "__main__":
 spark = SparkSession\
  .builder\
  .appName("testDataFrame")\
  .getOrCreate()
 
sentenceData = spark.createDataFrame([
 (0.0, "I like Spark"),
 (1.0, "Pandas is useful"),
 (2.0, "They are coded by Python ")
], ["label", "sentence"])
 
#显示数据
sentenceData.select("label").show()
 
#spark.DataFrame 转换成 pandas.DataFrame
sqlContest = SQLContext(sc)
spark_df = sqlContest.createDataFrame(df)
 
#显示数据
spark_df.select("c1").show()
 
 
# pandas.DataFrame 转换成 spark.DataFrame
pandas_df = sentenceData.toPandas()
 
#打印数据
print pandas_df

程序结果:

pyspark.sql.DataFrame与pandas.DataFrame之间的相互转换实例

以上这篇pyspark.sql.DataFrame与pandas.DataFrame之间的相互转换实例就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python中的赋值、浅拷贝、深拷贝介绍
Mar 09 Python
详解Python各大聊天系统的屏蔽脏话功能原理
Dec 01 Python
用tensorflow搭建CNN的方法
Mar 05 Python
Python基于百度AI的文字识别的示例
Apr 21 Python
对numpy数据写入文件的方法讲解
Jul 09 Python
Python装饰器语法糖
Jan 02 Python
python GUI库图形界面开发之PyQt5树形结构控件QTreeWidget详细使用方法与实例
Mar 02 Python
Python MySQLdb 执行sql语句时的参数传递方式
Mar 04 Python
Python3通过chmod修改目录或文件权限的方法示例
Jun 08 Python
如何基于pandas读取csv后合并两个股票
Sep 25 Python
matplotlib交互式数据光标实现(mplcursors)
Jan 13 Python
Python实现打乒乓小游戏
Sep 25 Python
Python实现两个list求交集,并集,差集的方法示例
Aug 02 #Python
python爬虫框架scrapy实现模拟登录操作示例
Aug 02 #Python
python爬虫之线程池和进程池功能与用法详解
Aug 02 #Python
Python列表推导式与生成器用法分析
Aug 02 #Python
python flask实现分页的示例代码
Aug 02 #Python
Django分页查询并返回jsons数据(中文乱码解决方法)
Aug 02 #Python
Python实现正整数分解质因数操作示例
Aug 01 #Python
You might like
php生成短网址示例
2014/05/05 PHP
php读取本地json文件的实例
2018/03/07 PHP
统一接口:为FireFox添加IE的方法和属性的js代码
2007/03/25 Javascript
Web Inspector:关于在 Sublime Text 中调试Js的介绍
2013/04/18 Javascript
浏览器的JavaScript引擎的识别方法
2013/10/20 Javascript
jquery获取tagName再进行判断
2014/05/29 Javascript
js数组去重的方法汇总
2015/07/29 Javascript
详解如何在NodeJS项目中优雅的使用ES6
2017/04/22 NodeJs
详解AngularJS跨页面传值(ui-router)
2017/08/23 Javascript
微信小程序swiper组件用法实例分析【附源码下载】
2017/12/07 Javascript
详解vue2.0 不同屏幕适配及px与rem转换问题
2018/02/23 Javascript
vue中使用codemirror的实例详解
2018/11/01 Javascript
Node.js之readline模块的使用详解
2019/03/25 Javascript
小程序实现锚点滑动效果
2019/09/23 Javascript
vue axios封装httpjs,接口公用配置拦截操作
2020/08/11 Javascript
解决vue-router 嵌套路由没反应的问题
2020/09/22 Javascript
windows 10下安装搭建django1.10.3和Apache2.4的方法
2017/04/05 Python
Python标准库之itertools库的使用方法
2017/09/07 Python
Python将多个list合并为1个list的方法
2018/06/27 Python
Python实现最大子序和的方法示例
2019/07/05 Python
Python实现微信翻译机器人的方法
2019/08/13 Python
python3实现往mysql中插入datetime类型的数据
2020/03/02 Python
pycharm开发一个简单界面和通用mvc模板(操作方法图解)
2020/05/27 Python
套娃式文件夹如何通过Python批量处理
2020/08/23 Python
CSS3 实用技巧:实现黑白图像效果示例代码
2013/07/11 HTML / CSS
HTML5 body设置自适应全屏
2020/05/07 HTML / CSS
Linux如何命名文件--使用文件名时应注意
2012/01/22 面试题
大一学生假期实习的自我评价
2013/10/12 职场文书
教师自我鉴定范文
2013/11/10 职场文书
市场开发与营销专业求职信范文
2014/05/01 职场文书
世界遗产导游词
2015/02/13 职场文书
2015年高考寄语或鼓励的话
2015/03/23 职场文书
爱国主题班会教案
2015/08/14 职场文书
话题作文之学会尊重
2019/12/16 职场文书
nginx请求限制配置方法
2021/07/09 Servers
Oracle中DBLink的详细介绍
2022/04/29 Oracle