python分析网页上所有超链接的方法


Posted in Python onMay 08, 2015

本文实例讲述了python分析网页上所有超链接的方法。分享给大家供大家参考。具体实现方法如下:

import urllib, htmllib, formatter
website = urllib.urlopen("http://yourweb.com")
data = website.read()
website.close()
format = formatter.AbstractFormatter(formatter.NullWriter())
ptext = htmllib.HTMLParser(format)
ptext.feed(data)
for link in ptext.anchorlist:
  print(link)

希望本文所述对大家的Python程序设计有所帮助。

Python 相关文章推荐
python连接远程ftp服务器并列出目录下文件的方法
Apr 01 Python
使用Python3编写抓取网页和只抓网页图片的脚本
Aug 20 Python
非递归的输出1-N的全排列实例(推荐)
Apr 11 Python
python实现简单登陆流程的方法
Apr 22 Python
python矩阵的转置和逆转实例
Dec 12 Python
python 将对象设置为可迭代的两种实现方法
Jan 21 Python
Python远程视频监控程序的实例代码
May 05 Python
Python画图实现同一结点多个柱状图的示例
Jul 07 Python
安装完Python包然后找不到模块的解决步骤
Feb 13 Python
Python类和实例的属性机制原理详解
Mar 21 Python
Python学习工具jupyter notebook安装及用法解析
Oct 23 Python
浅谈Python列表嵌套字典转化的问题
Apr 07 Python
python使用htmllib分析网页内容的方法
May 08 #Python
python使用nntp读取新闻组内容的方法
May 08 #Python
Python类的定义、继承及类对象使用方法简明教程
May 08 #Python
python通过imaplib模块读取gmail里邮件的方法
May 08 #Python
Python类定义和类继承详解
May 08 #Python
python使用smtplib模块通过gmail实现邮件发送的方法
May 08 #Python
python通过ftplib登录到ftp服务器的方法
May 08 #Python
You might like
php smarty模版引擎中的缓存应用
2009/12/02 PHP
php的memcached客户端memcached
2011/06/14 PHP
laravel中命名路由的使用方法
2017/02/24 PHP
swoole和websocket简单聊天室开发
2017/11/18 PHP
PHP基于swoole多进程操作示例
2019/08/12 PHP
破解Session cookie的方法
2006/07/28 Javascript
js中split函数的使用方法说明
2013/12/26 Javascript
javascript使用正则控制input输入框允许输入的值方法大全
2014/06/19 Javascript
5种处理js跨域问题方法汇总
2014/12/04 Javascript
jQuery判断指定id的对象是否存在的方法
2015/05/22 Javascript
javascript简单实现类似QQ头像弹出效果的方法
2015/08/03 Javascript
基于AngularJS实现页面滚动到底自动加载数据的功能
2015/10/16 Javascript
JavaScript通过代码调用Flash显示的方法
2016/02/02 Javascript
浅谈JavaScript的内置对象和浏览器对象
2016/06/03 Javascript
使用vue-router为每个路由配置各自的title
2018/07/30 Javascript
Vuepress 搭建带评论功能的静态博客的实现
2019/02/17 Javascript
详解mpvue实现对苹果X安全区域的适配
2019/07/31 Javascript
vue keep-alive列表页缓存 详情页返回上一页不刷新,定位到之前位置
2019/11/26 Javascript
[01:01:13]2018DOTA2亚洲邀请赛 4.5 淘汰赛 Mineski vs VG 第三场
2018/04/06 DOTA
为Python的web框架编写MVC配置来使其运行的教程
2015/04/30 Python
Python中__new__与__init__方法的区别详解
2015/05/04 Python
通过实例浅析Python对比C语言的编程思想差异
2015/08/30 Python
Python如何import文件夹下的文件(实现方法)
2017/01/24 Python
python实现n个数中选出m个数的方法
2018/11/13 Python
python实现可逆简单的加密算法
2019/03/22 Python
tensorflow自定义激活函数实例
2020/02/04 Python
css3 矩阵的使用详解
2018/03/20 HTML / CSS
基于canvas使用贝塞尔曲线平滑拟合折线段的方法
2018/01/10 HTML / CSS
Sony C++笔试题
2013/03/10 面试题
党员干部廉洁承诺书
2014/05/28 职场文书
教师反腐倡廉演讲稿
2014/09/03 职场文书
村干部群众路线教育活动对照检查材料
2014/10/01 职场文书
2014年监理工作总结范文
2014/11/17 职场文书
个人简历自我评价怎么写
2015/03/10 职场文书
go语言中http超时引发的事故解决
2021/06/02 Golang
Python使用mitmproxy工具监控手机 下载手机小视频
2022/04/18 Python