python使用htmllib分析网页内容的方法


Posted in Python onMay 08, 2015

本文实例讲述了python使用htmllib分析网页内容的方法。分享给大家供大家参考。具体实现方法如下:

import htmllib, urllib, formatter, sys
website = urllib.urlopen("http://yourweb.com")
data = website.read()
website.close()
format = formatter.AbstractFormatter(formatter.DumbWriter(sys.stdout))
ptext = htmllib.HTMLParser(format)
ptext.feed(data)
ptext.close()

希望本文所述对大家的Python程序设计有所帮助。

Python 相关文章推荐
Python字符串和文件操作常用函数分析
Apr 08 Python
Centos Python2 升级到Python3的简单实现
Jun 21 Python
轻松掌握python设计模式之访问者模式
Nov 18 Python
python爬虫框架scrapy实战之爬取京东商城进阶篇
Apr 24 Python
Python字符串处理实现单词反转
Jun 14 Python
Python numpy实现二维数组和一维数组拼接的方法
Jun 05 Python
对Python _取log的几种方式小结
Jul 25 Python
python lambda表达式在sort函数中的使用详解
Aug 28 Python
Python数据可视化:泊松分布详解
Dec 07 Python
浅谈tensorflow中Dataset图片的批量读取及维度的操作详解
Jan 20 Python
Python Selenium自动化获取页面信息的方法
Aug 31 Python
再也不用花钱买漫画!Python爬取某漫画的脚本及源码
Jun 09 Python
python使用nntp读取新闻组内容的方法
May 08 #Python
Python类的定义、继承及类对象使用方法简明教程
May 08 #Python
python通过imaplib模块读取gmail里邮件的方法
May 08 #Python
Python类定义和类继承详解
May 08 #Python
python使用smtplib模块通过gmail实现邮件发送的方法
May 08 #Python
python通过ftplib登录到ftp服务器的方法
May 08 #Python
python操作sqlite的CRUD实例分析
May 08 #Python
You might like
PHP连接access数据库
2008/03/27 PHP
上传文件先创建目录 再上传到目录里面去
2010/12/29 PHP
PHP过滤★等特殊符号的正则
2014/01/27 PHP
详解PHP素材图片上传、下载功能
2019/04/12 PHP
Jquery多选框互相内容交换的实例代码
2013/07/04 Javascript
JavaScript instanceof 的使用方法示例介绍
2013/10/23 Javascript
Javascript事件实例详解
2013/11/06 Javascript
为jQuery添加Webkit的触摸的方法分享
2014/02/02 Javascript
深入浅析JSON.parse()、JSON.stringify()和eval()的作用详解
2016/04/03 Javascript
JS中使用apply方法通过不同数量的参数调用函数的方法
2016/05/31 Javascript
浅谈Node.js:理解stream
2016/12/08 Javascript
AngularJS开发教程之控制器之间的通信方法分析
2016/12/25 Javascript
angular-ui-sortable实现可拖拽排序列表
2016/12/28 Javascript
Vue学习之路之登录注册实例代码
2017/07/06 Javascript
JavaScript ES6中的简写语法总结与使用技巧
2018/12/30 Javascript
Jquery实现无缝向上循环滚动列表的特效
2019/02/13 jQuery
微信小程序开发打开另一个小程序的实现方法
2020/05/17 Javascript
vue实现广告栏上下滚动效果
2020/11/26 Vue.js
Python实现从百度API获取天气的方法
2015/03/11 Python
总结Python中逻辑运算符的使用
2015/05/13 Python
Python中list初始化方法示例
2016/09/18 Python
python基础教程项目四之新闻聚合
2018/04/02 Python
pytorch中tensor的合并与截取方法
2018/07/26 Python
jupyter 中文乱码设置编码格式 避免控制台输出的解决
2020/04/20 Python
Python如何脚本过滤文件中的注释
2020/05/27 Python
CSS3弹性盒模型开发笔记(二)
2016/04/26 HTML / CSS
KIKO MILANO荷兰网上商店:意大利专业化妆品品牌
2017/05/12 全球购物
英国标准协会商店:BSI Shop
2019/02/25 全球购物
培训班主持词
2014/03/28 职场文书
经济信息系毕业生自荐信
2014/06/02 职场文书
分公司经理任命书
2014/06/05 职场文书
安全负责人任命书
2014/06/06 职场文书
学校领导班子成员查摆问题及整改措施
2014/10/28 职场文书
清明节寄语2015
2015/03/23 职场文书
如何撰写创业策划书
2019/06/27 职场文书
JavaScript+HTML实现学生信息管理系统
2021/04/20 Javascript