python BeautifulSoup设置页面编码的方法


Posted in Python onApril 03, 2015

在用BeautifulSoup进行抓取页面的时候,会各种各样的编码错误。
可以通过在beautifulsoup中指定字符编码,解决问题。

import urllib2  

from BeautifulSoup import BeautifulSoup  

  

page = urllib2.urlopen('http://www.163.com');  

soup = BeautifulSoup(page,from_encoding="gb2312")  

  

print soup.originalEncoding

print soup.prettify() 

红色部分表示需要注意的地方。在BeautifulSoup构造器中传入fromEncoding参数即可解决乱码问题,当然具体参数值是什么就要看你获取页面的编码是什么
Python 相关文章推荐
使用wxpython实现的一个简单图片浏览器实例
Jul 10 Python
pyqt5自定义信号实例解析
Jan 31 Python
python对于requests的封装方法详解
Jan 03 Python
详解Python循环作用域与闭包
Mar 21 Python
linux环境下Django的安装配置详解
Jul 22 Python
python opencv将表格图片按照表格框线分割和识别
Oct 30 Python
python通过链接抓取网站详解
Nov 20 Python
python GUI库图形界面开发之PyQt5开发环境配置与基础使用
Feb 25 Python
Python3批量创建Crowd用户并分配组
May 20 Python
Python常用数据分析模块原理解析
Jul 20 Python
python 模拟登录B站的示例代码
Dec 15 Python
python实现学生通讯录管理系统
Feb 25 Python
用Python编写一个简单的FUSE文件系统的教程
Apr 02 #Python
用Python中的__slots__缓存资源以节省内存开销的方法
Apr 02 #Python
用Python的线程来解决生产者消费问题的示例
Apr 02 #Python
用实例分析Python中method的参数传递过程
Apr 02 #Python
使用优化器来提升Python程序的执行效率的教程
Apr 02 #Python
使用Python脚本对Linux服务器进行监控的教程
Apr 02 #Python
在Python编程过程中用单元测试法调试代码的介绍
Apr 02 #Python
You might like
一个程序下载的管理程序(四)
2006/10/09 PHP
php获取地址栏信息的代码
2008/10/08 PHP
php下用cookie统计用户访问网页次数的代码
2010/05/09 PHP
常见php数据文件缓存类汇总
2014/12/05 PHP
php使用GD库创建图片缩略图的方法
2015/06/10 PHP
基于jquery的时间段实现代码
2012/08/02 Javascript
jquery实现textarea输入字符控制(仿微博输入控制字符)
2013/04/26 Javascript
jquery ajax实现下拉框三级无刷新联动,且保存保持选中值状态
2013/10/29 Javascript
javascript实现控制浏览器全屏
2015/03/30 Javascript
javascript实现类似java中getClass()得到对象类名的方法
2015/07/27 Javascript
jQuery实现本地预览上传图片功能
2016/01/08 Javascript
盘点javascript 正则表达式中 中括号的【坑】
2016/03/16 Javascript
关于bootstrap日期转化,bootstrap-editable的简单使用,bootstrap-fileinput的使用详解
2017/05/12 Javascript
VUE element-ui 写个复用Table组件的示例代码
2017/11/18 Javascript
jQuery实现百度图片移入移出内容提示框上下左右移动的效果
2018/06/05 jQuery
layui使用templet格式化表格数据的方法
2019/09/16 Javascript
超简单的微信小程序轮播图
2019/11/22 Javascript
jQuery实现鼠标移入显示蒙版效果
2020/01/11 jQuery
JS实现可控制的进度条
2020/03/25 Javascript
Python利用字典将两个通讯录文本合并为一个文本实例
2018/01/16 Python
python基础教程项目四之新闻聚合
2018/04/02 Python
python获取当前目录路径和上级路径的实例
2018/04/26 Python
python 简单照相机调用系统摄像头实现方法 pygame
2018/08/03 Python
对python创建及引用动态变量名的示例讲解
2018/11/10 Python
python常用运维脚本实例小结
2020/02/14 Python
Python之关于类变量的两种赋值区别详解
2020/03/12 Python
CSS3 translate导致字体模糊的实例代码
2019/08/30 HTML / CSS
意大利奢侈品零售商:ilDuomo Novara
2019/09/11 全球购物
Prototype如何为一个Ajax添加一个参数
2015/12/06 面试题
污水厂厂长岗位职责
2014/01/04 职场文书
运动会广播稿60字
2014/01/15 职场文书
精彩自我鉴定
2014/01/16 职场文书
师德个人剖析材料
2014/02/02 职场文书
搞笑车尾标语
2014/06/23 职场文书
出纳年终工作总结2014
2014/12/05 职场文书
2015年幼儿教师个人工作总结
2015/05/20 职场文书