编程 Python

Python读写Json涉及到中文的处理方法

Posted in Python onSeptember 12, 2016

今天在帮前端准备数据的时候，需要把数据格式转成json格式，说实话，涉及到中文有时候真的是很蛋疼，除非对Python的编码规则比较了解，不然处理起来真的很蛋疼。

整个逻辑

我们需要处理的是把一些文章处理，生成多个html文件，然后用json来显示文章的列表，图片，摘要和标题。

思路

为了以后的数据扩展，那必须有一个数据库，我的想法就是自己写一个简单的网页做为提交输入，然后post到后台以后录入到数据库中，再写一个展示文章的页面，展示效果正确后，写一个requests动态的把所有的数据都爬下来生成一个一个的html文档。最后的json数据我只要从数据库把数据抽出来生成就行了。

前端

其实前端的东西很简单，最近一直在写网页，所以前端的东西分分钟就搞定了。代码如下：

urls.py

from django.conf.urls import url, include
from . import views


urlpatterns = {
  url(r'^$', views.index, name='index'),
  url(r'add_article/', views.add_article, name='add_article'),
  url(r'^article/(?P<main_id>\S+)/$', views.article, name='article'),
}
views.py

# coding=utf-8
from django.shortcuts import render
from .models import Tzxy

# Create your views here.


def index(request):
  return render(request, 'index.html')


def add_article(request):
  error = 'error'
  if request.method == 'POST':
    # 获取前段request的内容
    main_id = request.POST['main_id']
    img_url = request.POST['img_url']
    title = request.POST['title']
    content = request.POST['content']
    abstract = content[:50]
    print main_id
    indb = Tzxy(
          main_id=main_id,
          img_url=img_url,
          title=title,
          content=content,
          abstract=abstract
          )
    indb.save()
    error = 'success'
    return render(request, 'index.html', {'error': error})
  return render(request, 'index.html')


def article(request, main_id):
  article_detial = Tzxy.objects.get(main_id=main_id)
  return render(request, 'views.html', {'content': article_detial})

models.py

from __future__ import unicode_literals
from django.db import models
from django.contrib import admin


class Tzxy(models.Model):
  main_id = models.CharField(max_length=10)
  img_url = models.CharField(max_length=50, null=True)
  title = models.CharField(max_length=50)
  content = models.TextField()
  abstract = models.CharField(max_length=200)

admin.site.register(Tzxy)

模板我就随便写了一个简单的表单

index.html

<!DOCTYPE html>
<html lang="en">
<head>
  <meta charset="UTF-8">
  <title>Title</title>
  <link href="http://libs.baidu.com/bootstrap/3.0.3/css/bootstrap.min.css" rel="stylesheet">
  <script src="http://libs.baidu.com/jquery/2.0.0/jquery.min.js"></script>
  <script src="http://libs.baidu.com/bootstrap/3.0.3/js/bootstrap.min.js"></script>
</head>
<body>
<form method="post" action="/tzxy/add_article/">
{% csrf_token %}
main_id: <input type="text" name="main_id"><br>
img_url: <input type="text" name="img_url"><br>
title: <input type="text" name="title"><br>
{% if error == 'success' %}
  <div class="alert alert-success">{{ error }}</div>
{% endif %}
<textarea name="content" rows="25" style="width: 600px;"></textarea><br>
  <input type="submit" name="Submit">
</form>
</body>
</html>

展示的页面

{% load custom_markdown %}
<!DOCTYPE html>
<html lang="zh-cn">
<head>
  <meta charset="UTF-8">
  <meta name="viewport" content="initial-scale=1.0,maximum-scale=1.0,minimum-scale=1.0,user-scalable=no" />
  <meta name="apple-touch-fullscreen" content="yes" />
  <meta name="apple-mobile-web-app-capable" content="yes" />
  <meta name="format-detection" content="telephone=no">
  <meta http-equiv="Cache-Control" content="no-store" />
  <meta http-equiv="Pragma" content="no-cache" />
  <meta http-equiv="Expires" content="0" />
  <title>{{ content.title }}</title>
  <link rel="stylesheet" href="../../css/cssreset.min.css">
  <link rel="stylesheet" href="../../css/fx_tzxy_content.min.css">
</head>
<body>

  <div class="page">
    <h1>{{ content.title }}</h1>
    <div class="content">
      {{ content.content | custom_markdown | linebreaksbr }}
    </div>
  </div>

</body>
</html>

当然，我里面使用了markdown来处理了一些数据。有关markdown的集成，可以移步《Django开发博客（六）——添加markdown支持》
爬数据的小脚本如下，需要使用到requests模块

# coding=utf-8
import sys
import requests
reload(sys)
sys.setdefaultencoding('utf8')


def tohtml(file_name, startpos, endpos):
  """
  请求网页数据后把网页源码存储为html格式,启动脚本时要先启动Django的Server
  :param file_name:生成文件名的前缀,最后一位用传入的数字来代替
  :param startpos:开始的数字
  :param endpos:结束的数字
  :return:None
  """

  for x in range(startpos, endpos):
    r = requests.get('http://127.0.0.1:8000/tzxy/article/' + file_name + str(x))
    with open('/Users/SvenWeng/Desktop/test/' + file_name + str(x) + '.html', 'w') as f:
      f.write(r.text)
  print 'success'


if __name__ == '__main__':
  tzhtl_name = 'tzxy_tzhtl_h_'
  djjyy_name = 'tzxy_djjyy_h_'
  tohtml(djjyy_name, 1, 39)

里面的一些命名自己可以根据需要去修改。

生成json

说实话，json的使用方式很简单，Python对json的支持也很好，不过涉及到中文就有点蛋疼了，我的代码是这样的：

# coding=utf-8
import sqlite3
import json
import sys
reload(sys)
sys.setdefaultencoding('utf8')

list_json = []

conn = sqlite3.connect('db.sqlite3')
c = conn.cursor()
sql = 'select * from Tzxy_tzxy'
c.execute(sql)
all_thing = c.fetchall()

for x in all_thing:
  dic_member = {'id': x[1].split('_')[3],
         'img': x[2],
         'title': x[3],
         'abstract': ''}
  list_json.append(dic_member)
conn.close()

final_json = json.dumps(list_json, sort_keys=True, indent=4)
with open('test.json', 'w') as f:
  f.write(final_json)

代码逻辑是：定义一个空列表，用来装生成的字典信息，然后从sqlite里面把之前存的数据全部抓出来。把数据循环生成自己想要的格式的字典，一个一个的插到列表中。再用Python提供的json.dumps方法把数据转成json格式，再写入文件就行了。
逻辑看上去是没什么问题，实现起来也很完美，但是最后我打开json文件检查的时候发现所有的中文都变成Unicode了。这简直是坑爹啊。

大致查了一下，好像网络上对这块说的内容并不详细，举得例子也都是非常非常简单的那种，直接给中文的，并不是我想要的，最后只能硬着头皮去看官方的说明，最后找到了这么一个东西ensure_ascii=False，在Python转Json的时候带上这个方法，也就是

final_json = json.dumps(list_json, sort_keys=True, indent=4, ensure_ascii=False)

这样处理之后，写入文件就是正常的中文了。

以上这篇Python读写Json涉及到中文的处理方法就是小编分享给大家的全部内容了，希望能给大家一个参考，也希望大家多多支持三水点靠木。

Python读写Json涉及到中文的处理方法

- Author -

jingxian

声明：登载此文出于传递更多信息之目的，并不意味着赞同其观点或证实其描述。

Python 相关文章推荐

python脚本实现查找webshell的方法

Jul 31 Python

跟老齐学Python之变量和参数

Oct 10 Python

Scrapy抓取京东商品、豆瓣电影及代码分享

Nov 23 Python

100行Python代码实现自动抢火车票（附源码）

Jan 11 Python

Python 爬虫之Beautiful Soup模块使用指南

Jul 05 Python

对python修改xml文件的节点值方法详解

Dec 24 Python

Django中如何防范CSRF跨站点请求伪造攻击的实现

Apr 28 Python

Python3+Requests+Excel完整接口自动化测试框架的实现

Oct 11 Python

python 读取数据库并绘图的实例

Dec 03 Python

浅谈tensorflow中Dataset图片的批量读取及维度的操作详解

Jan 20 Python

利用python生成照片墙的示例代码

Apr 09 Python

python IP地址转整数

Nov 20 Python

详细介绍Python的鸭子类型

Sep 12 #Python

Python 读写文件和file对象的方法(推荐)

Sep 12 #Python

使用Python进行二进制文件读写的简单方法(推荐)

Sep 12 #Python

浅谈python对象数据的读写权限

Sep 12 #Python

python获取list下标及其值的简单方法

Sep 12 #Python

Python循环语句中else的用法总结

Sep 11 #Python

python字典键值对的添加和遍历方法

Sep 11 #Python

You might like

CentOS下PHP7的编译安装及MySQL的支持和一些常见问题的解决办法

2015/12/17 PHP

如何使用微信公众平台开发模式实现多客服

2016/01/06 PHP

PHP登录验证码的实现与使用方法

2016/07/07 PHP

php json中文编码为null的解决办法

2016/12/14 PHP

golang 调用 php7详解及实例

2017/01/04 PHP

python进程与线程小结实例分析

2018/11/11 PHP

在html页面上拖放移动标签

2010/01/08 Javascript

使用jsonp完美解决跨域问题

2014/11/27 Javascript

推荐6款基于jQuery实现图片效果插件

2014/12/07 Javascript

jquery实现清新实用的网页菜单效果

2015/08/28 Javascript

JQuery中Ajax()的data参数类型实例分析

2015/12/15 Javascript

百度地图JavascriptApi Marker平滑移动及车头指向行径方向

2017/03/13 Javascript

Angular.JS中的指令引用template与指令当做属性详解

2017/03/30 Javascript

vue2.0+ 从插件开发到npm发布的示例代码

2018/04/28 Javascript

JS正则表达式验证端口范围(0-65535)

2020/01/06 Javascript

JavaScript canvas绘制圆弧与圆形

2020/02/18 Javascript

[01:38]完美世界高校联赛决赛花絮

2018/12/02 DOTA

python内存监控工具memory_profiler和guppy的用法详解

2019/07/29 Python

Python如何基于selenium实现自动登录博客园

2019/12/16 Python

pytorch 中pad函数toch.nn.functional.pad()的用法

2020/01/08 Python

python列表的逆序遍历实现

2020/04/20 Python

python代码如何注释

2020/06/01 Python

python安装mysql的依赖包mysql-python操作

2021/01/01 Python

Staples加拿大官方网站：办公用品一站式采购

2016/09/25 全球购物

高街生活方式全球在线商店：AZBRO

2017/08/26 全球购物

美国最大的万圣节服装网站：HalloweenCostumes.com

2017/10/12 全球购物

美国餐厅用品和厨房设备批发网站：KaTom Restaurant Supply

2018/01/27 全球购物

大学生求职自荐信

2013/12/12 职场文书

信息专业大学生自我评价分享

2014/01/17 职场文书

决心书标准格式

2014/03/11 职场文书

小学生开学第一课活动方案

2014/03/27 职场文书

听课评语大全

2014/04/30 职场文书

2015学校六五普法工作总结

2015/04/22 职场文书

员工工作心得体会

2019/05/07 职场文书

2019关于垃圾分类处理的调查报告

2019/12/26 职场文书

mysql多表查询-笔记七

2021/04/05 MySQL