python BeautifulSoup设置页面编码的方法


Posted in Python onApril 03, 2015

在用BeautifulSoup进行抓取页面的时候,会各种各样的编码错误。
可以通过在beautifulsoup中指定字符编码,解决问题。

import urllib2  

from BeautifulSoup import BeautifulSoup  

  

page = urllib2.urlopen('http://www.163.com');  

soup = BeautifulSoup(page,from_encoding="gb2312")  

  

print soup.originalEncoding

print soup.prettify() 

红色部分表示需要注意的地方。在BeautifulSoup构造器中传入fromEncoding参数即可解决乱码问题,当然具体参数值是什么就要看你获取页面的编码是什么
Python 相关文章推荐
Python使用Socket(Https)Post登录百度的实现代码
May 18 Python
分享一个常用的Python模拟登陆类
Mar 29 Python
python fabric使用笔记
May 09 Python
PyQt5每天必学之带有标签的复选框
Apr 19 Python
对Python 文件夹遍历和文件查找的实例讲解
Apr 26 Python
浅谈python中get pass用法
Mar 19 Python
详解python 爬取12306验证码
May 10 Python
python 比较2张图片的相似度的方法示例
Dec 18 Python
解决Python3.8用pip安装turtle-0.0.2出现错误问题
Feb 11 Python
Python3标准库之threading进程中管理并发操作方法
Mar 30 Python
用python修改excel表某一列内容的操作方法
Jun 11 Python
Python matplotlib 利用随机函数生成变化图形
Apr 26 Python
用Python编写一个简单的FUSE文件系统的教程
Apr 02 #Python
用Python中的__slots__缓存资源以节省内存开销的方法
Apr 02 #Python
用Python的线程来解决生产者消费问题的示例
Apr 02 #Python
用实例分析Python中method的参数传递过程
Apr 02 #Python
使用优化器来提升Python程序的执行效率的教程
Apr 02 #Python
使用Python脚本对Linux服务器进行监控的教程
Apr 02 #Python
在Python编程过程中用单元测试法调试代码的介绍
Apr 02 #Python
You might like
20个PHP常用类库小结
2011/09/11 PHP
在CentOS系统上从零开始搭建WordPress博客的全流程记录
2016/04/21 PHP
浅谈laravel-admin form中的数据,在提交后,保存前,获取并进行编辑
2019/10/21 PHP
Nigma vs Alliance BO5 第一场2.14
2021/03/10 DOTA
jQuery 标题的自动翻转实现代码
2009/10/14 Javascript
理解Javascript_15_作用域分配与变量访问规则,再送个闭包
2010/10/20 Javascript
基于jquery的拖动布局插件
2011/11/25 Javascript
jquery 表格排序、实时搜索表格内容(附图)
2014/05/19 Javascript
基于JavaScript实现单选框下拉菜单添加文件效果
2016/06/26 Javascript
一个超简单的jQuery回调函数例子(分享)
2016/08/08 Javascript
微信小程序 选择器(时间,日期,地区)实例详解
2016/11/16 Javascript
Javascript之面向对象--方法
2016/12/02 Javascript
JavaScript模块化之使用requireJS按需加载
2017/04/12 Javascript
JavaScript数据结构之二叉查找树的定义与表示方法
2017/04/12 Javascript
layui 中select下拉change事件失效的解决方法
2019/09/20 Javascript
layui加载数据显示loading加载完成loading消失的实例代码
2019/09/23 Javascript
node.js使用http模块创建服务器和客户端完整示例
2020/02/10 Javascript
[47:35]VP vs Pain 2018国际邀请赛小组赛BO2 第一场 8.18
2018/08/20 DOTA
python获取网页状态码示例
2014/03/30 Python
Python的Tornado框架异步编程入门实例
2015/04/24 Python
怎么使用pipenv管理你的python项目
2018/03/12 Python
Python实现程序判断季节的代码示例
2019/01/28 Python
python中yield的用法详解——最简单,最清晰的解释
2019/04/04 Python
Python面向对象实现一个对象调用另一个对象操作示例
2019/04/08 Python
解决python 上传图片限制格式问题
2019/10/30 Python
tensorflow 自定义损失函数示例代码
2020/02/05 Python
python Plotly绘图工具的简单使用
2020/03/03 Python
基于python实现模拟数据结构模型
2020/06/12 Python
世界最大的海报和艺术印刷商店:AllPosters.com
2017/02/01 全球购物
Lampegiganten丹麦:欧洲领先的照明网上商店
2018/04/25 全球购物
幼儿园教师获奖感言
2014/03/11 职场文书
创业培训计划书
2014/05/03 职场文书
李强优秀员工观后感
2015/06/16 职场文书
HTML中的表单Form实现居中效果
2021/05/25 HTML / CSS
8g内存用python读取10文件_面试题-python 如何读取一个大于 10G 的txt文件?
2021/05/28 Python
Spring Boot接口定义和全局异常统一处理
2022/04/20 Java/Android