python获取指定网页上所有超链接的方法


Posted in Python onApril 04, 2015

本文实例讲述了python获取指定网页上所有超链接的方法。分享给大家供大家参考。具体如下:

这段python代码通过urllib2抓取网页,然后通过简单的正则表达式分析网页上的全部url地址

import urllib2
import re
#connect to a URL
website = urllib2.urlopen(url)
#read html code
html = website.read()
#use re.findall to get all the links
links = re.findall('"((http|ftp)s?://.*?)"', html)
print links

希望本文所述对大家的python程序设计有所帮助。

Python 相关文章推荐
使用Python下载Bing图片(代码)
Nov 07 Python
python使用mysql的两种使用方式
Mar 07 Python
Python cookbook(数据结构与算法)同时对数据做转换和换算处理操作示例
Mar 23 Python
python微信公众号之关键词自动回复
Jun 15 Python
不到20行代码用Python做一个智能聊天机器人
Apr 19 Python
Python基于BeautifulSoup爬取京东商品信息
Jun 01 Python
python字符串的index和find的区别详解
Jun 20 Python
Django mysqlclient安装和使用详解
Sep 17 Python
python中random.randint和random.randrange的区别详解
Sep 20 Python
Pycharm创建文件时自动生成文件头注释(自定义设置作者日期)
Nov 24 Python
python爬虫线程池案例详解(梨视频短视频爬取)
Feb 20 Python
使用Python快速打开一个百万行级别的超大Excel文件的方法
Mar 02 Python
python中字典dict常用操作方法实例总结
Apr 04 #Python
python随机生成指定长度密码的方法
Apr 04 #Python
python统计字符串中指定字符出现次数的方法
Apr 04 #Python
python使用sorted函数对列表进行排序的方法
Apr 04 #Python
python实现的简单猜数字游戏
Apr 04 #Python
python使用BeautifulSoup分页网页中超链接的方法
Apr 04 #Python
python实现分析apache和nginx日志文件并输出访客ip列表的方法
Apr 04 #Python
You might like
无法在发生错误时创建会话,请检查 PHP 或网站服务器日志,并正确配置 PHP 安装(win+linux)
2012/05/05 PHP
JavaScript 仿关机效果的图片层
2008/12/26 Javascript
jQuery在IE下使用未闭合的xml代码创建元素时的Bug介绍
2012/01/10 Javascript
JavaScript中json对象和string对象之间相互转化
2012/12/26 Javascript
js propertychange和oninput事件
2014/09/28 Javascript
关于List.ToArray()方法的效率测试
2016/09/30 Javascript
js将table的每个td的内容自动赋值给其title属性的方法
2016/10/13 Javascript
Angular.js中用ng-repeat-start实现自定义显示
2016/10/18 Javascript
谈谈JS中常遇到的浏览器兼容问题和解决方法
2016/12/17 Javascript
ES6新特性三: Generator(生成器)函数详解
2017/04/21 Javascript
vue.js学习之UI组件开发教程
2017/07/03 Javascript
Javascript防止图片拉伸的自适应处理方法
2017/12/26 Javascript
angular 服务随记小结
2019/05/06 Javascript
Vue常用传值方式、父传子、子传父及非父子实例分析
2020/02/24 Javascript
JavaScript 空间坐标的使用
2020/08/19 Javascript
关于vue-cli3打包代码后白屏的解决方案
2020/09/02 Javascript
Python网络爬虫项目:内容提取器的定义
2016/10/25 Python
Python批量发送post请求的实现代码
2018/05/05 Python
对Python 窗体(tkinter)树状数据(Treeview)详解
2018/10/11 Python
Django如何防止定时任务并发浅析
2019/05/14 Python
Python 等分切分数据及规则命名的实例代码
2019/08/16 Python
Python基于BeautifulSoup爬取京东商品信息
2020/06/01 Python
html5 worker 实例(一) 为什么测试不到效果
2013/06/24 HTML / CSS
如何现实servlet的单线程模式
2014/08/05 面试题
致长跑运动员广播稿
2014/01/31 职场文书
残疾人创业典型事迹
2014/02/01 职场文书
暑期社会实践方案
2014/02/05 职场文书
师说教学反思
2014/02/07 职场文书
教师四风自我剖析材料
2014/09/30 职场文书
计划生育诚信协议书
2014/11/02 职场文书
公积金接收函格式
2015/01/30 职场文书
演讲开场白台词大全
2015/05/29 职场文书
孟佩杰观后感
2015/06/17 职场文书
小学三年级班主任工作经验交流材料
2015/11/02 职场文书
Golang map映射的用法
2022/04/22 Golang
六个好看实用的 HTML + CSS 后台登录入口页面
2022/04/28 HTML / CSS