python BeautifulSoup设置页面编码的方法


Posted in Python onApril 03, 2015

在用BeautifulSoup进行抓取页面的时候,会各种各样的编码错误。
可以通过在beautifulsoup中指定字符编码,解决问题。

import urllib2  

from BeautifulSoup import BeautifulSoup  

  

page = urllib2.urlopen('http://www.163.com');  

soup = BeautifulSoup(page,from_encoding="gb2312")  

  

print soup.originalEncoding

print soup.prettify() 

红色部分表示需要注意的地方。在BeautifulSoup构造器中传入fromEncoding参数即可解决乱码问题,当然具体参数值是什么就要看你获取页面的编码是什么
Python 相关文章推荐
安装Python的web.py框架并从hello world开始编程
Apr 25 Python
举例讲解Django中数据模型访问外键值的方法
Jul 21 Python
浅谈python内置变量-reversed(seq)
Jun 21 Python
Django使用 Bootstrap 样式修改书籍列表过程解析
Aug 09 Python
在pytorch中为Module和Tensor指定GPU的例子
Aug 19 Python
Python tkinter实现图片标注功能(完整代码)
Dec 08 Python
浅谈Pycharm最有必要改的几个默认设置项
Feb 14 Python
python 安装库几种方法之cmd,anaconda,pycharm详解
Apr 08 Python
pyCharm 设置调试输出窗口中文显示方式(字符码转换)
Jun 09 Python
Python爬虫抓取指定网页图片代码实例
Jul 24 Python
Python基于mediainfo批量重命名图片文件
Dec 29 Python
分析Python list操作为什么会错误
Nov 17 Python
用Python编写一个简单的FUSE文件系统的教程
Apr 02 #Python
用Python中的__slots__缓存资源以节省内存开销的方法
Apr 02 #Python
用Python的线程来解决生产者消费问题的示例
Apr 02 #Python
用实例分析Python中method的参数传递过程
Apr 02 #Python
使用优化器来提升Python程序的执行效率的教程
Apr 02 #Python
使用Python脚本对Linux服务器进行监控的教程
Apr 02 #Python
在Python编程过程中用单元测试法调试代码的介绍
Apr 02 #Python
You might like
PHP网站建设的流程与步骤分享
2015/09/25 PHP
Yii中CGridView禁止列排序的设置方法
2016/07/12 PHP
php 从指定数字中获取随机组合的简单方法(推荐)
2017/04/05 PHP
摘自百度的图片轮换效果代码
2007/11/19 Javascript
jquery text,radio,checkbox,select操作实现代码
2009/07/09 Javascript
jquery 列表双向选择器之改进版
2013/08/09 Javascript
下拉列表选择项的选中在不同浏览器中的兼容性问题探讨
2013/09/18 Javascript
JQuery文本改变触发事件如聚焦事件、失焦事件
2014/01/15 Javascript
jquery解析xml字符串简单示例
2014/04/11 Javascript
Nodejs Post请求报socket hang up错误的解决办法
2014/09/25 NodeJs
jquery中EasyUI实现同步树
2015/03/01 Javascript
以jQuery中$.Deferred对象为例讲解promise对象是如何处理异步问题
2015/11/13 Javascript
多种JQuery循环滚动文字图片效果代码
2020/06/23 Javascript
浅析Javascript ES6中的原生Promise
2016/08/25 Javascript
Bootstrap php制作动态分页标签
2016/12/23 Javascript
Bootstrap超大屏幕的实现代码
2017/03/22 Javascript
深入浅出webpack教程系列_安装与基本打包用法和命令参数详解
2017/09/10 Javascript
vue 挂载路由到头部导航的方法
2017/11/13 Javascript
Vue shopCart 组件开发详解
2018/01/26 Javascript
浅谈Vue render函数在ElementUi中的应用
2018/09/06 Javascript
微信小程序实现点击图片旋转180度并且弹出下拉列表
2018/11/27 Javascript
JS多个异步请求 按顺序执行next实现解析
2019/09/16 Javascript
Python Requests模拟登录实现图书馆座位自动预约
2018/04/27 Python
检测tensorflow是否使用gpu进行计算的方式
2020/02/03 Python
Python调用飞书发送消息的示例
2020/11/10 Python
Python3.9.1中使用match方法详解
2021/02/08 Python
使用phonegap播放音频的实现方法
2017/03/31 HTML / CSS
能否解释一下XSS cookie盗窃是什么意思
2012/06/02 面试题
优秀部门获奖感言
2014/02/14 职场文书
市场总经理岗位职责
2014/04/11 职场文书
服务宗旨标语
2014/07/01 职场文书
2016春节家属慰问信
2015/03/25 职场文书
600字作文之感受大自然
2019/11/27 职场文书
MySQL优化之如何写出高质量sql语句
2021/05/17 MySQL
ubuntu安装jupyter并设置远程访问的实现
2022/03/31 Python
CSS link与@import的区别和用法解析
2023/05/07 HTML / CSS