Python提取网页中超链接的方法


Posted in Python onSeptember 18, 2016

下面是最简单的实现方法,先将目标网页抓回来,然后通过正则匹配a标签中的href属性来获得超链接

代码如下:

import urllib2
import re
 
url = 'http://www.sunbloger.com/'
 
req = urllib2.Request(url)
con = urllib2.urlopen(req)
doc = con.read()
con.close()
 
links = re.findall(r'href\=\"(http\:\/\/[a-zA-Z0-9\.\/]+)\"', doc)
for a in links:
  print a

总结

以上就是这篇文章的全部内容,希望本文的内容对大家的学习或者工作能有所帮助,如果有疑问大家可以留言交流。

Python 相关文章推荐
win7 下搭建sublime的python开发环境的配置方法
Jun 18 Python
Python教程之全局变量用法
Jun 27 Python
Python常见的pandas用法demo示例
Mar 16 Python
Python Django框架单元测试之文件上传测试示例
May 17 Python
python binascii 进制转换实例
Jun 12 Python
Python generator生成器和yield表达式详解
Aug 08 Python
python3+opencv 使用灰度直方图来判断图片的亮暗操作
Jun 02 Python
完美解决ARIMA模型中plot_acf画不出图的问题
Jun 04 Python
opencv 图像礼帽和图像黑帽的实现
Jul 07 Python
拿来就用!Python批量合并PDF的示例代码
Aug 10 Python
python连接手机自动搜集蚂蚁森林能量的实现代码
Feb 24 Python
超详细Python解释器新手安装教程
May 10 Python
python解决Fedora解压zip时中文乱码的方法
Sep 18 #Python
Python自动化运维和部署项目工具Fabric使用实例
Sep 18 #Python
基于Python 的进程管理工具supervisor使用指南
Sep 18 #Python
打包发布Python模块的方法详解
Sep 18 #Python
在python的类中动态添加属性与生成对象
Sep 17 #Python
Python中字符串的处理技巧分享
Sep 17 #Python
Python中对象迭代与反迭代的技巧总结
Sep 17 #Python
You might like
Smarty Foreach 使用说明
2010/03/23 PHP
PHP 开发环境配置(Zend Studio)
2010/04/28 PHP
windows下开发并编译PHP扩展的方法
2011/03/18 PHP
PHP获取网页标题的3种实现方法代码实例
2014/04/11 PHP
php自动识别文件编码并转换为UTF-8的方法
2014/06/12 PHP
ThinkPHP中pathinfo的访问模式、路径访问模式及URL重写总结
2014/08/23 PHP
PHP利用APC模块实现文件上传进度条的方法
2015/01/26 PHP
[原创]php集成安装包wampserver修改密码后phpmyadmin无法登陆的解决方法
2016/11/23 PHP
jQuery+php简单实现全选删除的方法
2016/11/28 PHP
Zend Framework入门教程之Zend_Registry组件用法详解
2016/12/09 PHP
用JavaScript脚本实现Web页面信息交互
2006/12/21 Javascript
很可爱的输入框
2008/08/03 Javascript
线路分流自动智能跳转代码,自动选择最快镜像网站(js)
2011/10/31 Javascript
jQuery中的read和JavaScript中的onload函数的区别
2014/08/27 Javascript
基于nodejs+express(4.x+)实现文件上传功能
2015/11/23 NodeJs
javascript 数组的定义和数组的长度
2016/06/07 Javascript
微信小程序实现鼠标拖动效果示例
2017/12/01 Javascript
详解Vue单元测试case写法
2018/05/24 Javascript
浅谈vue中关于checkbox数据绑定v-model指令的个人理解
2018/11/14 Javascript
vue 导航锚点_点击平滑滚动,导航栏对应变化详解
2020/08/10 Javascript
python多线程用法实例详解
2015/01/15 Python
Python 中 Meta Classes详解
2016/02/13 Python
Python抓取聚划算商品分析页面获取商品信息并以XML格式保存到本地
2018/02/23 Python
python numpy格式化打印的实例
2018/05/14 Python
Python实现全排列的打印
2018/08/18 Python
python requests.post带head和body的实例
2019/01/02 Python
python scatter散点图用循环分类法加图例
2019/03/19 Python
pycharm 实现本地写代码,服务器运行的操作
2020/06/08 Python
python的链表基础知识点
2020/09/13 Python
python 发送邮件的四种方法汇总
2020/12/02 Python
英国家庭珠宝商:T. H. Baker
2018/02/08 全球购物
新西兰Bookabach:查找全球度假屋
2020/12/03 全球购物
小学学雷锋活动总结
2014/04/25 职场文书
2015年领班工作总结
2015/04/29 职场文书
数学复习课教学反思
2016/02/18 职场文书
Redis5之后版本的高可用集群搭建的实现
2021/04/27 Redis