python使用htmllib分析网页内容的方法


Posted in Python onMay 08, 2015

本文实例讲述了python使用htmllib分析网页内容的方法。分享给大家供大家参考。具体实现方法如下:

import htmllib, urllib, formatter, sys
website = urllib.urlopen("http://yourweb.com")
data = website.read()
website.close()
format = formatter.AbstractFormatter(formatter.DumbWriter(sys.stdout))
ptext = htmllib.HTMLParser(format)
ptext.feed(data)
ptext.close()

希望本文所述对大家的Python程序设计有所帮助。

Python 相关文章推荐
Python计算回文数的方法
Mar 11 Python
python装饰器与递归算法详解
Feb 18 Python
利用Python获取赶集网招聘信息前篇
Apr 18 Python
python使用Apriori算法进行关联性解析
Dec 21 Python
TensorFlow实现RNN循环神经网络
Feb 28 Python
win7+Python3.5下scrapy的安装方法
Jul 31 Python
python numpy实现文件存取的示例代码
May 26 Python
Django之创建引擎索引报错及解决详解
Jul 17 Python
在pycharm中配置Anaconda以及pip源配置详解
Sep 09 Python
python3中pip3安装出错,找不到SSL的解决方式
Dec 12 Python
pytorch构建多模型实例
Jan 15 Python
pytorch forward两个参数实例
Jan 17 Python
python使用nntp读取新闻组内容的方法
May 08 #Python
Python类的定义、继承及类对象使用方法简明教程
May 08 #Python
python通过imaplib模块读取gmail里邮件的方法
May 08 #Python
Python类定义和类继承详解
May 08 #Python
python使用smtplib模块通过gmail实现邮件发送的方法
May 08 #Python
python通过ftplib登录到ftp服务器的方法
May 08 #Python
python操作sqlite的CRUD实例分析
May 08 #Python
You might like
漫威DC即将合作联动,而双方早已经秘密开始
2020/04/09 欧美动漫
PHP实现支持加盐的图片加密解密
2016/09/09 PHP
PHP设计模式之建造者模式定义与用法简单示例
2018/08/13 PHP
JQuery下关于$.Ready()的分析
2009/12/13 Javascript
JS 显示当前日期与时间的代码
2010/03/24 Javascript
jquery中防刷IP流量软件影响统计的一点对策
2011/07/10 Javascript
使用js实现关闭js弹出层的窗口
2014/02/10 Javascript
javascript/jquery获取地址栏url参数的方法
2014/03/05 Javascript
如何改进javascript代码的性能
2015/04/02 Javascript
JavaScript数组和循环详解
2015/04/27 Javascript
jquery append 动态添加的元素事件on 不起作用的解决方案
2015/07/30 Javascript
在jQuery中处理XML数据的大致方法
2015/08/14 Javascript
iOS和Android用同一个二维码实现跳转下载链接的方法
2016/09/28 Javascript
浅谈JS读取DOM对象(标签)的自定义属性
2016/11/21 Javascript
AngularJS打开页面隐藏显示表达式用法示例
2016/12/25 Javascript
Django1.7+JQuery+Ajax验证用户注册集成小例子
2017/04/08 jQuery
JS去掉字符串中所有的逗号
2017/10/18 Javascript
vue 全选与反选的实现方法(无Bug 新手看过来)
2018/02/09 Javascript
详解React之父子组件传递和其它一些要点
2018/06/25 Javascript
vue指令之表单控件绑定v-model v-model与v-bind结合使用
2019/04/17 Javascript
TypeScript中使用getElementXXX()的示例代码
2019/09/12 Javascript
javascript随机变色实例代码
2019/10/15 Javascript
JavaScript实现随机点名程序
2020/03/25 Javascript
[02:07]DOTA2超级联赛专访BBC:难忘网吧超神经历
2013/06/09 DOTA
[04:26]2014DOTA2西雅图国际邀请赛 总决赛TOPPLAY
2014/07/22 DOTA
Scrapy框架CrawlSpiders的介绍以及使用详解
2017/11/29 Python
Python使用正则表达式获取网页中所需要的信息
2018/01/29 Python
selenium3+python3环境搭建教程图解
2018/12/07 Python
Python进阶:生成器 懒人版本的迭代器详解
2019/06/29 Python
Django框架配置mysql数据库实现过程
2020/04/22 Python
澳大利亚自然和有机的健康美容产品一站式商店:Ziani Beauty
2017/12/28 全球购物
就业协议书样本
2014/08/20 职场文书
校园文化艺术节宣传标语
2014/10/09 职场文书
2014年药品销售工作总结
2014/12/16 职场文书
JavaScript原型链详解
2021/11/07 Javascript
Python 统计序列中元素的出现频度
2022/04/26 Python