Python输出\u编码将其转换成中文的实例


Posted in Python onDecember 15, 2018

爬取了下小猪短租的网站出租房信息但是输出的时候是这种:

Python输出\u编码将其转换成中文的实例

百度了下。python2.7在window上的编码确实是个坑

解决如下

如果是个字典的话要先将其转成字符串 导入json库

然后 这么输出(json.dumps(data).decode("unicode-escape"))

整个代码demo

# -*- coding: UTF-8 -*-
#小猪短租爬取
import requests
from bs4 import BeautifulSoup
import json
def get_xinxi(i):
 url = 'http://cd.xiaozhu.com/search-duanzufang-p%d-0/' %i
 html = requests.get(url)
 soup = BeautifulSoup(html.content)
 #获取地址
 dizhis=soup.select(' div > a > span')
 #获取价格
 prices = soup.select(' span.result_price')
 #获取简单信息
 ems = soup.select(' div > em')
 datas =[]
 for dizhi,price,em in zip(dizhis,prices,ems):
  data={
   '价格':price.get_text(),
   '信息':em.get_text().replace('\n','').replace(' ',''),
   '地址':dizhi.get_text()
  }
  print(json.dumps(data).decode("unicode-escape"))
i=1
while(i<12):
 get_xinxi(i)
 i=i+1

爬取了12页的信息

Python输出\u编码将其转换成中文的实例

小结:

压注意的是

创建soup

soup = BeautifulSoup(html.content)

多个值的for赋值

for dizhi,price,em in zip(dizhis,prices,ems):

字典的输出编码问题

json.dumps(data).decode("unicode-escape")

如果想获取每个个详细信息可以获取其href属性值

#page_list > ul > li:nth-of-type(1) > a

然后获取其属性值get(‘href')获取每个的详情信息在解析页面获取想要的信息加在data字典中

以上这篇Python输出\u编码将其转换成中文的实例就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python生成随机MAC地址
Mar 10 Python
Python中利用sorted()函数排序的简单教程
Apr 27 Python
Python实现屏幕截图的代码及函数详解
Oct 01 Python
python3.5 + PyQt5 +Eric6 实现的一个计算器代码
Mar 11 Python
python用pickle模块实现“增删改查”的简易功能
Jun 07 Python
python实现简单淘宝秒杀功能
May 03 Python
python3使用SMTP发送简单文本邮件
Jun 19 Python
Pycharm代码无法复制,无法选中删除,无法编辑的解决方法
Oct 22 Python
快速解决vue.js 模板和jinja 模板冲突的问题
Jul 26 Python
python使用itchat模块给心爱的人每天发天气预报
Nov 25 Python
django 链接多个数据库 并使用原生sql实现
Mar 28 Python
Python爬虫入门教程01之爬取豆瓣Top电影
Jan 24 Python
对python:print打印时加u的含义详解
Dec 15 #Python
Python 最大概率法进行汉语切分的方法
Dec 14 #Python
python实现任意位置文件分割的实例
Dec 14 #Python
pytorch permute维度转换方法
Dec 14 #Python
Python语言快速上手学习方法
Dec 14 #Python
分享Python切分字符串的一个不错方法
Dec 14 #Python
在python中按照特定顺序访问字典的方法详解
Dec 14 #Python
You might like
无数据库的详细域名查询程序PHP版(1)
2006/10/09 PHP
PHP 截取字符串函数整理(支持gb2312和utf-8)
2010/02/16 PHP
分享下页面关键字抓取components.arrow.com站点代码
2014/01/30 PHP
用js正确判断用户名cookie是否存在的方法
2014/01/28 Javascript
jquery中子元素和后代元素的区别示例介绍
2014/04/02 Javascript
JavaScript DOM节点添加示例
2014/07/16 Javascript
jQuery选择器用法实例详解
2015/12/17 Javascript
jquery仿QQ登录账号选择下拉框效果
2016/03/22 Javascript
Bootstrap开发实战之第一次接触Bootstrap
2016/06/02 Javascript
js中使用使用原型(prototype)定义方法的好处详解
2016/07/04 Javascript
实现React单页应用的方法详解
2016/08/02 Javascript
Node解决简单重复问题系列之Excel内容的获取
2018/01/02 Javascript
Taro集成Redux快速上手的方法示例
2018/06/21 Javascript
vue+iview 兼容IE11浏览器的实现方法
2019/01/07 Javascript
通过高德地图API获得某条道路上的所有坐标用于描绘道路的方法
2020/08/24 Javascript
Vue实现boradcast和dispatch的示例
2020/11/13 Javascript
[02:12]DOTA2英雄基础教程 变体精灵
2013/12/16 DOTA
详解Python发送邮件实例
2016/01/10 Python
Python pymongo模块用法示例
2018/03/31 Python
Python里字典的基本用法(包括嵌套字典)
2019/02/27 Python
实例详解Python装饰器与闭包
2019/07/29 Python
Python+AutoIt实现界面工具开发过程详解
2019/08/07 Python
python禁用键鼠与提权代码实例
2019/08/16 Python
css3实现wifi信号逐渐增强效果实例
2017/08/09 HTML / CSS
Reebok俄罗斯官方网上商店:购买锐步运动服装和鞋子
2016/09/26 全球购物
苏宁红孩子母婴商城:redbaby
2017/02/12 全球购物
采用怎样的方法保证数据的完整性
2013/12/02 面试题
作风建设年活动总结
2014/08/27 职场文书
政法干警核心价值观心得体会
2014/09/11 职场文书
财会专业大学生求职信
2014/09/26 职场文书
2014年办公室工作总结范文
2014/11/12 职场文书
家长学校教学计划
2015/01/19 职场文书
房产公证书格式
2015/01/26 职场文书
员工离职通知函
2015/04/25 职场文书
《观察物体》教学反思
2016/02/17 职场文书
超级详细实用的pycharm常用快捷键
2021/05/12 Python