深入解析Python编程中JSON模块的使用


Posted in Python onOctober 15, 2015

JSON编码支持的基本数据类型为 None , bool , int , float 和 str , 以及包含这些类型数据的lists,tuples和dictionaries。 对于dictionaries,keys需要是字符串类型(字典中任何非字符串类型的key在编码时会先转换为字符串)。 为了遵循JSON规范,你应该只编码Python的lists和dictionaries。 而且,在web应用程序中,顶层对象被编码为一个字典是一个标准做法。

JSON编码的格式对于Python语法而已几乎是完全一样的,除了一些小的差异之外。 比如,True会被映射为true,False被映射为false,而None会被映射为null。 下面是一个例子,演示了编码后的字符串效果:

>>> json.dumps(False)
'false'
>>> d = {'a': True,
...   'b': 'Hello',
...   'c': None}
>>> json.dumps(d)
'{"b": "Hello", "c": null, "a": true}'
>>>

如果你试着去检查JSON解码后的数据,你通常很难通过简单的打印来确定它的结构, 特别是当数据的嵌套结构层次很深或者包含大量的字段时。 为了解决这个问题,可以考虑使用pprint模块的 pprint() 函数来代替普通的 print() 函数。 它会按照key的字母顺序并以一种更加美观的方式输出。 下面是一个演示如何漂亮的打印输出Twitter上搜索结果的例子:

>>> from urllib.request import urlopen
>>> import json
>>> u = urlopen('http://search.twitter.com/search.json?q=python&rpp=5')
>>> resp = json.loads(u.read().decode('utf-8'))
>>> from pprint import pprint
>>> pprint(resp)
{'completed_in': 0.074,
'max_id': 264043230692245504,
'max_id_str': '264043230692245504',
'next_page': '?page=2&max_id=264043230692245504&q=python&rpp=5',
'page': 1,
'query': 'python',
'refresh_url': '?since_id=264043230692245504&q=python',
'results': [{'created_at': 'Thu, 01 Nov 2012 16:36:26 +0000',
      'from_user': ...
      },
      {'created_at': 'Thu, 01 Nov 2012 16:36:14 +0000',
      'from_user': ...
      },
      {'created_at': 'Thu, 01 Nov 2012 16:36:13 +0000',
      'from_user': ...
      },
      {'created_at': 'Thu, 01 Nov 2012 16:36:07 +0000',
      'from_user': ...
      }
      {'created_at': 'Thu, 01 Nov 2012 16:36:04 +0000',
      'from_user': ...
      }],
'results_per_page': 5,
'since_id': 0,
'since_id_str': '0'}
>>>

一般来讲,JSON解码会根据提供的数据创建dicts或lists。 如果你想要创建其他类型的对象,可以给 json.loads() 传递object_pairs_hook或object_hook参数。 例如,下面是演示如何解码JSON数据并在一个OrderedDict中保留其顺序的例子:

>>> s = '{"name": "ACME", "shares": 50, "price": 490.1}'
>>> from collections import OrderedDict
>>> data = json.loads(s, object_pairs_hook=OrderedDict)
>>> data
OrderedDict([('name', 'ACME'), ('shares', 50), ('price', 490.1)])
>>>

下面是如何将一个JSON字典转换为一个Python对象例子:

>>> class JSONObject:
...   def __init__(self, d):
...     self.__dict__ = d
...
>>>
>>> data = json.loads(s, object_hook=JSONObject)
>>> data.name
'ACME'
>>> data.shares
50
>>> data.price
490.1
>>>

最后一个例子中,JSON解码后的字典作为一个单个参数传递给 __init__() 。 然后,你就可以随心所欲的使用它了,比如作为一个实例字典来直接使用它。

在编码JSON的时候,还有一些选项很有用。 如果你想获得漂亮的格式化字符串后输出,可以使用 json.dumps() 的indent参数。 它会使得输出和pprint()函数效果类似。比如:

>>> print(json.dumps(data))
{"price": 542.23, "name": "ACME", "shares": 100}
>>> print(json.dumps(data, indent=4))
{
  "price": 542.23,
  "name": "ACME",
  "shares": 100
}
>>>

对象实例通常并不是JSON可序列化的。例如:

>>> class Point:
...   def __init__(self, x, y):
...     self.x = x
...     self.y = y
...
>>> p = Point(2, 3)
>>> json.dumps(p)
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
  File "/usr/local/lib/python3.3/json/__init__.py", line 226, in dumps
    return _default_encoder.encode(obj)
  File "/usr/local/lib/python3.3/json/encoder.py", line 187, in encode
    chunks = self.iterencode(o, _one_shot=True)
  File "/usr/local/lib/python3.3/json/encoder.py", line 245, in iterencode
    return _iterencode(o, 0)
  File "/usr/local/lib/python3.3/json/encoder.py", line 169, in default
    raise TypeError(repr(o) + " is not JSON serializable")
TypeError: <__main__.Point object at 0x1006f2650> is not JSON serializable
>>>

如果你想序列化对象实例,你可以提供一个函数,它的输入是一个实例,返回一个可序列化的字典。例如:

def serialize_instance(obj):
  d = { '__classname__' : type(obj).__name__ }
  d.update(vars(obj))
  return d

如果你想反过来获取这个实例,可以这样做:

# Dictionary mapping names to known classes
classes = {
  'Point' : Point
}

def unserialize_object(d):
  clsname = d.pop('__classname__', None)
  if clsname:
    cls = classes[clsname]
    obj = cls.__new__(cls) # Make instance without calling __init__
    for key, value in d.items():
      setattr(obj, key, value)
      return obj
  else:
    return d

下面是如何使用这些函数的例子:

>>> p = Point(2,3)
>>> s = json.dumps(p, default=serialize_instance)
>>> s
'{"__classname__": "Point", "y": 3, "x": 2}'
>>> a = json.loads(s, object_hook=unserialize_object)
>>> a
<__main__.Point object at 0x1017577d0>
>>> a.x
2
>>> a.y
3
>>>

json 模块还有很多其他选项来控制更低级别的数字、特殊值如NaN等的解析。 可以参考官方文档获取更多细节。

Python 相关文章推荐
python冒泡排序算法的实现代码
Nov 21 Python
python处理cookie详解
Feb 07 Python
python删除特定文件的方法
Jul 30 Python
微信跳一跳辅助python代码实现
Jan 05 Python
python pandas 组内排序、单组排序、标号的实例
Apr 12 Python
Pandas中把dataframe转成array的方法
Apr 13 Python
Flask框架踩坑之ajax跨域请求实现
Feb 22 Python
关于pandas的离散化,面元划分详解
Nov 22 Python
Python如何爬取qq音乐歌词到本地
Jun 01 Python
Python-for循环的内部机制
Jun 12 Python
如何理解python对象
Jun 21 Python
Ubuntu20下的Django安装的方法步骤
Jan 24 Python
使用Python解析JSON数据的基本方法
Oct 15 #Python
深入讲解Python编程中的字符串
Oct 14 #Python
Python编程中字符串和列表的基本知识讲解
Oct 14 #Python
Python循环语句之break与continue的用法
Oct 14 #Python
Python编程中的for循环语句学习教程
Oct 14 #Python
在Python的while循环中使用else以及循环嵌套的用法
Oct 14 #Python
解析Python中while true的使用
Oct 13 #Python
You might like
ionCube 一款类似zend的PHP加密/解密工具
2010/07/25 PHP
php中is_null,empty,isset,unset 的区别详细介绍
2013/04/28 PHP
php mysql_real_escape_string函数用法与实例教程
2013/09/30 PHP
PHP中使用strpos函数实现屏蔽敏感关键字功能
2014/08/21 PHP
php获取CSS文件中图片地址并下载到本地的方法
2014/12/02 PHP
jquery获得下拉框值的代码
2011/08/13 Javascript
一行代码告别document.getElementById
2012/06/01 Javascript
解析瀑布流布局:JS+绝对定位的实现
2013/05/08 Javascript
Jquery.Form 异步提交表单的简单实例
2014/03/03 Javascript
JavaScript输出当前时间Unix时间戳的方法
2015/04/06 Javascript
JavaScript记录光标在编辑器中位置的实现方法
2016/04/22 Javascript
详解JavaScript中js对象与JSON格式字符串的相互转换
2017/02/14 Javascript
ES6新特性之模块Module用法详解
2017/04/01 Javascript
NodeJS设计模式总结【单例模式,适配器模式,装饰模式,观察者模式】
2017/09/06 NodeJs
react-native fetch的具体使用方法
2017/11/01 Javascript
快速搭建React的环境步骤详解
2017/11/06 Javascript
Element-ui中元素滚动时el-option超出元素区域的问题
2019/05/30 Javascript
[02:56]DOTA2亚洲邀请赛 VG出场战队巡礼
2015/02/07 DOTA
[47:03]完美世界DOTA2联赛PWL S3 Galaxy Racer vs Phoenix 第二场 12.10
2020/12/13 DOTA
python 生成目录树及显示文件大小的代码
2009/07/23 Python
Python matplotlib画图实例之绘制拥有彩条的图表
2017/12/28 Python
pandas数据集的端到端处理
2019/02/18 Python
Python散点图与折线图绘制过程解析
2019/11/30 Python
使用Python测试Ping主机IP和某端口是否开放的实例
2019/12/17 Python
python判断两个序列的成员是否一样的实例代码
2020/03/01 Python
css3动画过渡实现鼠标跟随导航效果
2018/02/08 HTML / CSS
Furla官网:意大利著名的皮革品牌
2019/08/06 全球购物
自立自强的名人事例
2014/02/10 职场文书
专业求职信撰写要诀
2014/02/18 职场文书
难忘的一课教学反思
2014/04/30 职场文书
安全生产大检查方案
2014/05/07 职场文书
2015试用期转正工作总结
2014/12/12 职场文书
本科毕业论文指导教师评语
2014/12/30 职场文书
爱国电影观后感
2015/06/19 职场文书
Python中的pprint模块
2021/11/27 Python
Apache Kafka 分区重分配的实现原理解析
2022/07/15 Servers