python获取指定网页上所有超链接的方法


Posted in Python onApril 04, 2015

本文实例讲述了python获取指定网页上所有超链接的方法。分享给大家供大家参考。具体如下:

这段python代码通过urllib2抓取网页,然后通过简单的正则表达式分析网页上的全部url地址

import urllib2
import re
#connect to a URL
website = urllib2.urlopen(url)
#read html code
html = website.read()
#use re.findall to get all the links
links = re.findall('"((http|ftp)s?://.*?)"', html)
print links

希望本文所述对大家的python程序设计有所帮助。

Python 相关文章推荐
python实现文件名批量替换和内容替换
Mar 20 Python
python局域网ip扫描示例分享
Apr 03 Python
Python写入数据到MP3文件中的方法
Jul 10 Python
python使用matplotlib绘制柱状图教程
Feb 08 Python
python脚本生成caffe train_list.txt的方法
Apr 27 Python
使用Python监控文件内容变化代码实例
Jun 04 Python
Python3.8中使用f-strings调试
May 22 Python
Django模型修改及数据迁移实现解析
Aug 01 Python
python机器学习包mlxtend的安装和配置详解
Aug 21 Python
python文件操作的简单方法总结
Nov 07 Python
python常用排序算法的实现代码
Nov 08 Python
matplotlib交互式数据光标实现(mplcursors)
Jan 13 Python
python中字典dict常用操作方法实例总结
Apr 04 #Python
python随机生成指定长度密码的方法
Apr 04 #Python
python统计字符串中指定字符出现次数的方法
Apr 04 #Python
python使用sorted函数对列表进行排序的方法
Apr 04 #Python
python实现的简单猜数字游戏
Apr 04 #Python
python使用BeautifulSoup分页网页中超链接的方法
Apr 04 #Python
python实现分析apache和nginx日志文件并输出访客ip列表的方法
Apr 04 #Python
You might like
编写自己的php扩展函数
2006/10/09 PHP
一个显示天气预报的程序
2006/10/09 PHP
php的GD库imagettftext函数解决中文乱码问题
2015/01/24 PHP
PHPExcel在linux环境下导出报500错误的解决方法
2017/01/26 PHP
详解使用php调用微信接口上传永久素材
2017/04/11 PHP
php数组函数array_push()、array_pop()及array_shift()简单用法示例
2020/01/26 PHP
ASP.NET jQuery 实例16 通过控件CustomValidator验证RadioButtonList
2012/02/03 Javascript
在JS数组特定索引处指定位置插入元素的技巧
2014/08/24 Javascript
javascript引用类型指针的工作方式
2015/04/13 Javascript
javascript中if和switch,==和===详解
2015/07/30 Javascript
jQuery Uploadify 上传插件出现Http Error 302 错误的解决办法
2015/12/12 Javascript
jquery+Jscex打造游戏力度条
2020/09/12 Javascript
Node.js复制文件的方法示例
2016/12/29 Javascript
Vue数据驱动模拟实现4
2017/01/12 Javascript
利用Node.js+Koa框架实现前后端交互的方法
2017/02/27 Javascript
原生js实现旋转木马轮播图效果
2017/02/27 Javascript
JS实现倒计时图文效果
2018/11/17 Javascript
Vue中Table组件Select的勾选和取消勾选事件详解
2019/03/19 Javascript
Javascript的this详解
2019/03/23 Javascript
js实现限定范围拖拽的示例
2020/10/26 Javascript
Python3实现的腾讯微博自动发帖小工具
2013/11/11 Python
Python3解决棋盘覆盖问题的方法示例
2017/12/07 Python
django实现类似触发器的功能
2019/11/15 Python
python打开文件的方式有哪些
2020/06/29 Python
浅谈Python里面None True False之间的区别
2020/07/09 Python
给Django Admin添加验证码和多次登录尝试限制的实现
2020/07/26 Python
中国跨境电子商务网站:NewFrog
2018/03/10 全球购物
如何打印出当前源文件的文件名以及源文件的当前行号
2015/04/05 面试题
售后服务经理岗位职责
2014/02/25 职场文书
关工委先进个人事迹材料
2014/05/23 职场文书
党员群众路线个人整改措施思想汇报
2014/10/12 职场文书
单位接收证明格式
2015/06/18 职场文书
工作简报格式范文
2015/07/21 职场文书
Python Pandas知识点之缺失值处理详解
2021/05/11 Python
Python 中 Shutil 模块详情
2021/11/11 Python
python字符串拼接.join()和拆分.split()详解
2021/11/23 Python