python获取指定网页上所有超链接的方法


Posted in Python onApril 04, 2015

本文实例讲述了python获取指定网页上所有超链接的方法。分享给大家供大家参考。具体如下:

这段python代码通过urllib2抓取网页,然后通过简单的正则表达式分析网页上的全部url地址

import urllib2
import re
#connect to a URL
website = urllib2.urlopen(url)
#read html code
html = website.read()
#use re.findall to get all the links
links = re.findall('"((http|ftp)s?://.*?)"', html)
print links

希望本文所述对大家的python程序设计有所帮助。

Python 相关文章推荐
python冒泡排序算法的实现代码
Nov 21 Python
python返回昨天日期的方法
May 13 Python
Python制作爬虫抓取美女图
Jan 20 Python
判断网页编码的方法python版
Aug 12 Python
Python寻找两个有序数组的中位数实例详解
Dec 05 Python
Django+JS 实现点击头像即可更改头像的方法示例
Dec 26 Python
详解Python修复遥感影像条带的两种方式
Feb 23 Python
基于Numba提高python运行效率过程解析
Mar 02 Python
Django框架配置mysql数据库实现过程
Apr 22 Python
降低python版本的操作方法
Sep 11 Python
在PyCharm中安装PaddlePaddle的方法
Feb 05 Python
python井字棋游戏实现人机对战
Apr 28 Python
python中字典dict常用操作方法实例总结
Apr 04 #Python
python随机生成指定长度密码的方法
Apr 04 #Python
python统计字符串中指定字符出现次数的方法
Apr 04 #Python
python使用sorted函数对列表进行排序的方法
Apr 04 #Python
python实现的简单猜数字游戏
Apr 04 #Python
python使用BeautifulSoup分页网页中超链接的方法
Apr 04 #Python
python实现分析apache和nginx日志文件并输出访客ip列表的方法
Apr 04 #Python
You might like
DC的38部超级英雄动画电影
2020/03/03 欧美动漫
php expects parameter 1 to be resource, array given 错误
2011/03/23 PHP
PHP中使用sleep函数实现定时任务实例分享
2014/08/21 PHP
php中动态调用函数的方法
2015/03/16 PHP
php实现分页显示
2015/11/03 PHP
利用php-cli和任务计划实现刷新token功能的方法
2017/05/03 PHP
关于UTF-8的客户端用AJAX方式获取GB2312的服务器端乱码问题的解决办法
2010/11/30 Javascript
菜鸟javascript基础资料整理2
2010/12/06 Javascript
input 输入框获得/失去焦点时隐藏/显示文字(jquery版)
2013/04/02 Javascript
JS中的this变量的使用介绍
2013/10/21 Javascript
分享jQuery插件的学习笔记
2016/01/14 Javascript
纯JS代码实现气泡效果
2016/05/04 Javascript
纯前端JavaScript实现Excel IO案例分享
2016/08/26 Javascript
jquery心形点赞关注效果的简单实现
2016/11/14 Javascript
详解ECharts使用心得总结
2016/12/06 Javascript
ES5学习教程之Array对象
2017/04/01 Javascript
JS简单实现自定义右键菜单实例
2017/05/31 Javascript
vue项目移动端实现ip输入框问题
2019/03/19 Javascript
layui实现数据表格点击搜索功能
2020/03/26 Javascript
ES6 Iterator遍历器原理,应用场景及相关常用知识拓展详解
2020/02/15 Javascript
Vue 实现对quill-editor组件中的工具栏添加title
2020/08/03 Javascript
在RedHat系Linux上部署Python的Celery框架的教程
2015/04/07 Python
python奇偶行分开存储实现代码
2018/03/19 Python
python实现自动发送邮件
2018/06/20 Python
python调用opencv实现猫脸检测功能
2019/01/15 Python
python实现贪吃蛇游戏
2020/03/21 Python
Python qqbot 实现qq机器人的示例代码
2019/07/11 Python
Python for循环及基础用法详解
2019/11/08 Python
Python识别html主要文本框过程解析
2020/02/18 Python
美国LOGO设计公司:The Logo Company
2018/07/16 全球购物
行政助理工作职责范本
2014/03/04 职场文书
应用心理学专业求职信
2014/08/04 职场文书
匿名检举信范文
2015/03/02 职场文书
2015年维修工作总结
2015/04/25 职场文书
初中班主任教育随笔
2015/08/15 职场文书
一级电子管军用接收机测评
2022/04/05 无线电