python分析网页上所有超链接的方法


Posted in Python onMay 08, 2015

本文实例讲述了python分析网页上所有超链接的方法。分享给大家供大家参考。具体实现方法如下:

import urllib, htmllib, formatter
website = urllib.urlopen("http://yourweb.com")
data = website.read()
website.close()
format = formatter.AbstractFormatter(formatter.NullWriter())
ptext = htmllib.HTMLParser(format)
ptext.feed(data)
for link in ptext.anchorlist:
  print(link)

希望本文所述对大家的Python程序设计有所帮助。

Python 相关文章推荐
Python检测网站链接是否已存在
Apr 07 Python
详解Python的Flask框架中的signals信号机制
Jun 13 Python
python实现图片处理和特征提取详解
Nov 13 Python
Python读取Excel表格,并同时画折线图和柱状图的方法
Oct 14 Python
Python numpy中矩阵的基本用法汇总
Feb 12 Python
总结Python图形用户界面和游戏开发知识点
May 22 Python
selenium处理元素定位点击无效问题
Jun 12 Python
python 实现在tkinter中动态显示label图片的方法
Jun 13 Python
python基于Selenium的web自动化框架
Jul 14 Python
利用python-pypcap抓取带VLAN标签的数据包方法
Jul 23 Python
python实现输入的数据在地图上生成热力图效果
Dec 06 Python
手把手教你如何用Pycharm2020.1.1配置远程连接的详细步骤
Aug 07 Python
python使用htmllib分析网页内容的方法
May 08 #Python
python使用nntp读取新闻组内容的方法
May 08 #Python
Python类的定义、继承及类对象使用方法简明教程
May 08 #Python
python通过imaplib模块读取gmail里邮件的方法
May 08 #Python
Python类定义和类继承详解
May 08 #Python
python使用smtplib模块通过gmail实现邮件发送的方法
May 08 #Python
python通过ftplib登录到ftp服务器的方法
May 08 #Python
You might like
php面向对象全攻略 (九)访问类型
2009/09/30 PHP
在PHP中利用wsdl创建标准webservice的实现代码
2011/12/07 PHP
PHP基于自定义函数实现的汉字转拼音功能实例
2017/09/30 PHP
不间断滚动JS打包类,基本可以实现所有的滚动效果,太强了
2007/12/08 Javascript
JavaScript 继承详解(一)
2009/07/13 Javascript
js/jquery判断浏览器类型的方法小结
2015/05/12 Javascript
深入浅析Node.js 事件循环
2015/12/20 Javascript
Bootstrap源码解读下拉菜单(4)
2016/12/23 Javascript
解析JavaScript实现DDoS攻击原理与保护措施
2016/12/26 Javascript
基于Vue2实现的仿手机QQ单页面应用功能(接入聊天机器人 )
2017/03/30 Javascript
VUE重点问题总结
2018/03/19 Javascript
layui 解决form表单点击无反应的问题
2019/10/25 Javascript
swiper实现导航滚动效果
2020/12/13 Javascript
[38:32]DOTA2上海特级锦标赛A组资格赛#2 Secret VS EHOME第二局
2016/02/26 DOTA
[39:46]完美世界DOTA2联赛PWL S2 LBZS vs Rebirth 第二场 11.25
2020/11/25 DOTA
Python和JavaScript间代码转换的4个工具
2016/02/22 Python
启动Atom并运行python文件的步骤
2018/11/09 Python
Python一句代码实现找出所有水仙花数的方法
2018/11/13 Python
python 读取数据库并绘图的实例
2019/12/03 Python
解决Jupyter Notebook开始菜单栏Anaconda下消失的问题
2020/04/13 Python
编写html5时调试发现脚本php等网页js、css等失效
2013/12/31 HTML / CSS
欧铁通票官方在线销售网站:Eurail.com
2017/10/14 全球购物
美国在线旅行社:Crystal Travel
2018/09/11 全球购物
密封类可以有虚函数吗
2014/08/11 面试题
物流管理专业大学生自荐信
2013/10/04 职场文书
高校自主招生自荐信
2013/12/09 职场文书
大学毕业后的十年规划
2014/01/07 职场文书
个人授权委托书模板
2014/09/14 职场文书
酒店管理失职检讨书
2014/09/16 职场文书
2014年自愿离婚协议书范本
2014/09/25 职场文书
2016年教师师德师风心得体会
2016/01/12 职场文书
2016创先争优活动党员公开承诺书
2016/03/24 职场文书
导游词之襄阳古城
2019/09/27 职场文书
日元符号 ¥
2022/02/17 杂记
MySQL索引 高效获取数据的数据结构
2022/05/02 MySQL
一文搞懂Java中的注解和反射
2022/06/21 Java/Android