Python输出\u编码将其转换成中文的实例


Posted in Python onDecember 15, 2018

爬取了下小猪短租的网站出租房信息但是输出的时候是这种:

Python输出\u编码将其转换成中文的实例

百度了下。python2.7在window上的编码确实是个坑

解决如下

如果是个字典的话要先将其转成字符串 导入json库

然后 这么输出(json.dumps(data).decode("unicode-escape"))

整个代码demo

# -*- coding: UTF-8 -*-
#小猪短租爬取
import requests
from bs4 import BeautifulSoup
import json
def get_xinxi(i):
 url = 'http://cd.xiaozhu.com/search-duanzufang-p%d-0/' %i
 html = requests.get(url)
 soup = BeautifulSoup(html.content)
 #获取地址
 dizhis=soup.select(' div > a > span')
 #获取价格
 prices = soup.select(' span.result_price')
 #获取简单信息
 ems = soup.select(' div > em')
 datas =[]
 for dizhi,price,em in zip(dizhis,prices,ems):
  data={
   '价格':price.get_text(),
   '信息':em.get_text().replace('\n','').replace(' ',''),
   '地址':dizhi.get_text()
  }
  print(json.dumps(data).decode("unicode-escape"))
i=1
while(i<12):
 get_xinxi(i)
 i=i+1

爬取了12页的信息

Python输出\u编码将其转换成中文的实例

小结:

压注意的是

创建soup

soup = BeautifulSoup(html.content)

多个值的for赋值

for dizhi,price,em in zip(dizhis,prices,ems):

字典的输出编码问题

json.dumps(data).decode("unicode-escape")

如果想获取每个个详细信息可以获取其href属性值

#page_list > ul > li:nth-of-type(1) > a

然后获取其属性值get(‘href')获取每个的详情信息在解析页面获取想要的信息加在data字典中

以上这篇Python输出\u编码将其转换成中文的实例就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
在Python中使用判断语句和循环的教程
Apr 25 Python
Python爬取APP下载链接的实现方法
Sep 30 Python
使用Python3制作TCP端口扫描器
Apr 17 Python
Python 在字符串中加入变量的实例讲解
May 02 Python
python学习笔记--将python源文件打包成exe文件(pyinstaller)
May 26 Python
django 解决manage.py migrate无效的问题
May 27 Python
基于scrapy的redis安装和配置方法
Jun 13 Python
解决python写入mysql中datetime类型遇到的问题
Jun 21 Python
Python3 assert断言实现原理解析
Mar 02 Python
python GUI框架pyqt5 对图片进行流式布局的方法(瀑布流flowlayout)
Mar 12 Python
pip install 使用国内镜像的方法示例
Apr 03 Python
Python参数传递机制传值和传引用原理详解
May 22 Python
对python:print打印时加u的含义详解
Dec 15 #Python
Python 最大概率法进行汉语切分的方法
Dec 14 #Python
python实现任意位置文件分割的实例
Dec 14 #Python
pytorch permute维度转换方法
Dec 14 #Python
Python语言快速上手学习方法
Dec 14 #Python
分享Python切分字符串的一个不错方法
Dec 14 #Python
在python中按照特定顺序访问字典的方法详解
Dec 14 #Python
You might like
ThinkPHP3.1新特性之查询条件预处理简介
2014/06/19 PHP
php通过session防url攻击方法
2014/12/10 PHP
ThinkPHP文件缓存类代码分享
2015/04/22 PHP
PHP实现多文件上传的方法
2015/07/08 PHP
PHP生成唯一ID之SnowFlake算法
2016/12/17 PHP
PHP大文件分片上传的实现方法
2018/10/28 PHP
laravel框架与其他框架的详细对比
2019/10/23 PHP
经验几则 推荐
2006/09/05 Javascript
jquery zTree异步加载简单实例分享
2013/02/05 Javascript
原始XMLHttpRequest方法详情回顾
2013/11/28 Javascript
jquery鼠标停止移动事件
2013/12/21 Javascript
NodeJS学习笔记之网络编程
2014/08/03 NodeJs
探寻Javascript执行效率问题
2014/11/12 Javascript
javascript常用代码段搜集
2014/12/04 Javascript
javascript实现瀑布流加载图片原理
2016/02/02 Javascript
js调用webservice构造SOAP进行身份验证
2016/04/27 Javascript
深入理解Angular2 模板语法
2016/08/07 Javascript
基于jQuery实现的幻灯图片切换
2016/12/02 Javascript
面试常见的js算法题
2017/03/23 Javascript
vue项目实现记住密码到cookie功能示例(附源码)
2018/01/31 Javascript
layer插件实现在弹出层中弹出一警告提示并关闭弹出层的方法
2019/09/24 Javascript
深入理解基于vue-cli的webpack打包优化实践及探索
2019/10/14 Javascript
微信小程序录音实现功能并上传(使用node解析接收)
2020/02/26 Javascript
[02:57]DOTA2亚洲邀请赛小组赛第四日 赛事回顾
2015/02/02 DOTA
[02:27]《DAC最前线》之附加赛征程
2015/01/29 DOTA
Python编写Windows Service服务程序
2018/01/04 Python
高效使用Python字典的清单
2018/04/04 Python
详解配置Django的Celery异步之路踩坑
2018/11/25 Python
django项目简单调取百度翻译接口的方法
2019/08/06 Python
Python使用requests模块爬取百度翻译
2020/08/25 Python
法国大使拉杆箱官网:DELSEY Paris
2018/03/20 全球购物
EJB发布WEB服务一般步骤
2012/10/31 面试题
致跳高运动员广播稿
2014/01/13 职场文书
九年级体育教学反思
2014/01/23 职场文书
详解MySQL InnoDB存储引擎的内存管理
2021/04/08 MySQL
python本地文件服务器实例教程
2021/05/02 Python