读取json格式为DataFrame(可转为.csv)的实例讲解


Posted in Python onJune 05, 2018

有时候需要读取一定格式的json文件为DataFrame,可以通过json来转换或者pandas中的read_json()。

import pandas as pd
import json
data = pd.DataFrame(json.loads(open('jsonFile.txt','r+').read()))#方法一
dataCopy = pd.read_json('jsonFile.txt',typ='frame') #方法二
pandas.read_json(path_or_buf=None, orient=None, typ='frame', dtype=True, convert_axes=True, convert_dates=True, keep_default_dates=True, numpy=False, precise_float=False, date_unit=None, encoding=None, lines=False)[source]
 Convert a JSON string to pandas object
 Parameters: 
 path_or_buf : a valid JSON string or file-like, default: None
 The string could be a URL. Valid URL schemes include http, ftp, s3, and file. For file URLs, a host is expected. For instance, a local file could be file://localhost/path/to/table.json
 orient : string,
 Indication of expected JSON string format. Compatible JSON strings can be produced by to_json() with a corresponding orient value. The set of possible orients is:
  'split' : dict like {index -> [index], columns -> [columns], data -> [values]}
  'records' : list like [{column -> value}, ... , {column -> value}]
  'index' : dict like {index -> {column -> value}}
  'columns' : dict like {column -> {index -> value}}
  'values' : just the values array
 The allowed and default values depend on the value of the typ parameter.
  when typ == 'series',
  allowed orients are {'split','records','index'}
  default is 'index'
  The Series index must be unique for orient 'index'.
  when typ == 'frame',
  allowed orients are {'split','records','index', 'columns','values'}
  default is 'columns'
  The DataFrame index must be unique for orients 'index' and 'columns'.
  The DataFrame columns must be unique for orients 'index', 'columns', and 'records'.
 typ : type of object to recover (series or frame), default ‘frame'
 dtype : boolean or dict, default True
 If True, infer dtypes, if a dict of column to dtype, then use those, if False, then don't infer dtypes at all, applies only to the data.
 convert_axes : boolean, default True
 Try to convert the axes to the proper dtypes.
 convert_dates : boolean, default True
 List of columns to parse for dates; If True, then try to parse datelike columns default is True; a column label is datelike if
  it ends with '_at',
  it ends with '_time',
  it begins with 'timestamp',
  it is 'modified', or
  it is 'date'
 keep_default_dates : boolean, default True
 If parsing dates, then parse the default datelike columns
 numpy : boolean, default False
 Direct decoding to numpy arrays. Supports numeric data only, but non-numeric column and index labels are supported. Note also that the JSON ordering MUST be the same for each term if numpy=True.
 precise_float : boolean, default False
 Set to enable usage of higher precision (strtod) function when decoding string to double values. Default (False) is to use fast but less precise builtin functionality
 date_unit : string, default None
 The timestamp unit to detect if converting dates. The default behaviour is to try and detect the correct precision, but if this is not desired then pass one of ‘s', ‘ms', ‘us' or ‘ns' to force parsing only seconds, milliseconds, microseconds or nanoseconds respectively.
 lines : boolean, default False
 Read the file as a json object per line.
 New in version 0.19.0.
 encoding : str, default is ‘utf-8'
 The encoding to use to decode py3 bytes.
 New in version 0.19.0.

以上这篇读取json格式为DataFrame(可转为.csv)的实例讲解就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
一篇不错的Python入门教程
Feb 08 Python
使用Python脚本来控制Windows Azure的简单教程
Apr 16 Python
django 2.0更新的10条注意事项总结
Jan 05 Python
python与sqlite3实现解密chrome cookie实例代码
Jan 20 Python
Python 3.x 安装opencv+opencv_contrib的操作方法
Apr 02 Python
Python爬虫之正则表达式的使用教程详解
Oct 25 Python
Python实现简单石头剪刀布游戏
Jan 20 Python
TensorFlow tf.nn.max_pool实现池化操作方式
Jan 04 Python
Python基于yield遍历多个可迭代对象
Mar 12 Python
详解python中的闭包
Sep 07 Python
Django基于Models定制Admin后台实现过程解析
Nov 11 Python
python基础之匿名函数详解
Apr 21 Python
Python实现迭代时使用索引的方法示例
Jun 05 #Python
Numpy 将二维图像矩阵转换为一维向量的方法
Jun 05 #Python
django反向解析和正向解析的方式
Jun 05 #Python
Python numpy实现二维数组和一维数组拼接的方法
Jun 05 #Python
Python实现字典(dict)的迭代操作示例
Jun 05 #Python
python矩阵转换为一维数组的实例
Jun 05 #Python
python验证码识别教程之利用滴水算法分割图片
Jun 05 #Python
You might like
Ajax实时验证用户名/邮箱等是否已经存在的代码打包
2011/12/01 PHP
php抽象类使用要点与注意事项分析
2015/02/09 PHP
wordpress安装过程中遇到中文乱码的处理方法
2015/04/21 PHP
PHP SPL 被遗落的宝石【SPL应用浅析】
2018/04/20 PHP
php实现微信公众平台发红包功能
2018/06/14 PHP
php7新特性的理解和比较总结
2019/04/14 PHP
php 策略模式原理与应用深入理解
2019/09/25 PHP
JS打开图片另存为对话框实现代码
2012/12/26 Javascript
jQuery获取页面及个元素高度、宽度的总结——超实用
2015/07/28 Javascript
Bootstrap被封装的弹层
2016/07/20 Javascript
jquery实现网页定位导航
2016/08/23 Javascript
用vue和node写的简易购物车实现
2017/04/25 Javascript
vue2.0结合Element实现select动态控制input禁用实例
2017/05/12 Javascript
vue+vue-validator 表单验证功能的实现代码
2017/11/13 Javascript
高性能的javascript之加载顺序与执行原理篇
2018/01/14 Javascript
Vue移动端用淘宝弹性布局lib-flexible插件做适配的方法
2020/05/26 Javascript
微信小程序自定义modal弹窗组件的方法详解
2020/12/20 Javascript
[28:42]Ti4正赛VG vs NEWBEE1
2014/07/19 DOTA
教你如何在Django 1.6中正确使用 Signal
2014/06/22 Python
Python提取网页中超链接的方法
2016/09/18 Python
详解Python多线程Selenium跨浏览器测试
2017/04/01 Python
python解决pandas处理缺失值为空字符串的问题
2018/04/08 Python
Django项目中用JS实现加载子页面并传值的方法
2018/05/28 Python
python实现梯度法 python最速下降法
2020/03/24 Python
Python新手学习装饰器
2020/06/04 Python
CSS3中伪元素::before和::after的用法示例
2017/09/18 HTML / CSS
AmazeUI框架搭建的方法步骤(图文)
2020/08/17 HTML / CSS
美国在线旅行社:Crystal Travel
2018/09/11 全球购物
德国的各种媒体在线商店:Thalia.de(书籍、电子书、玩具等)
2020/10/08 全球购物
企业优秀员工事迹材料
2014/05/28 职场文书
党的群众路线对照检查材料范文
2014/09/24 职场文书
2015年城管执法工作总结
2015/07/23 职场文书
如何使用Tkinter进行窗口的管理与设置
2021/06/30 Python
MySQL系列之一 MariaDB-server安装
2021/07/02 MySQL
python字符串的一些常见实用操作
2022/04/06 Python
python开发制作好看的时钟效果
2022/05/02 Python