python使用正则表达式提取网页URL的方法


Posted in Python onMay 26, 2015

本文实例讲述了python使用正则表达式提取网页URL的方法。分享给大家供大家参考。具体实现方法如下:

import re
import urllib
url="https://3water.com"
s=urllib.urlopen(url).read()
ss=s.replace(" ","")
urls=re.findall(r"<a.*?href=.*?<\/a>",ss,re.I)
for i in urls:
 print i
else:
 print 'this is over'
Python 相关文章推荐
python中的字典详细介绍
Sep 18 Python
Python随机生成彩票号码的方法
Mar 05 Python
使用Python的Scrapy框架编写web爬虫的简单示例
Apr 17 Python
Python的Django框架中从url中捕捉文本的方法
Jul 20 Python
Python编程入门之Hello World的三种实现方式
Nov 13 Python
使用python画个小猪佩奇的示例代码
Jun 06 Python
如何基于python实现脚本加密
Dec 28 Python
pyecharts动态轨迹图的实现示例
Apr 17 Python
Python使用sys.exc_info()方法获取异常信息
Jul 23 Python
Python matplotlib模块及柱状图用法解析
Aug 10 Python
python基本算法之实现归并排序(Merge sort)
Sep 01 Python
Python3+Django get/post请求实现教程详解
Feb 16 Python
python获取指定路径下所有指定后缀文件的方法
May 26 #Python
python通过apply使用元祖和列表调用函数实例
May 26 #Python
python获取一组数据里最大值max函数用法实例
May 26 #Python
Python实现求最大公约数及判断素数的方法
May 26 #Python
Python实现队列的方法
May 26 #Python
Python实现栈的方法
May 26 #Python
Python实现二分查找算法实例
May 26 #Python
You might like
德生1994机评
2021/03/02 无线电
PHP-CGI进程CPU 100% 与 file_get_contents 函数的关系分析
2011/08/15 PHP
PHP使用CURL_MULTI实现多线程采集的例子
2014/07/29 PHP
PHP高精确度运算BC函数库实例详解
2017/08/15 PHP
TP3.2框架分页相关实现方法分析
2020/06/03 PHP
js+FSO遍历文件夹下文件并显示
2007/03/07 Javascript
javascript import css实例代码
2008/07/18 Javascript
js控制的回到页面顶端goTop的代码实现
2013/03/20 Javascript
下拉框select的绑定示例
2014/09/04 Javascript
Node.js 制作实时多人游戏框架
2015/01/08 Javascript
js关于命名空间的函数实例
2015/02/05 Javascript
JS实现网页顶部向下滑出的全国城市切换导航效果
2015/08/22 Javascript
jquery模拟实现鼠标指针停止运动事件
2016/01/12 Javascript
javascript中json基础知识详解
2017/01/19 Javascript
详解windows下vue-cli及webpack 构建网站(二)导入bootstrap样式
2017/06/17 Javascript
Vue官网todoMVC示例代码
2018/01/29 Javascript
Vue-drag-resize 拖拽缩放插件的使用(简单示例)
2019/12/04 Javascript
浅析VUE防抖与节流
2020/11/24 Vue.js
wxpython中利用线程防止假死的实现方法
2014/08/11 Python
wxPython框架类和面板类的使用实例
2014/09/28 Python
Python中datetime模块参考手册
2017/01/13 Python
详解Python多线程Selenium跨浏览器测试
2017/04/01 Python
Django框架教程之正则表达式URL误区详解
2018/01/28 Python
python绘制立方体的方法
2018/07/02 Python
Python DataFrame一列拆成多列以及一行拆成多行
2019/08/06 Python
Python3实现发送邮件和发送短信验证码功能
2020/01/07 Python
PyInstaller运行原理及常用操作详解
2020/06/13 Python
Django视图类型总结
2021/02/17 Python
详解CSS3选择器的使用方法汇总
2015/11/24 HTML / CSS
HTML5 canvas基本绘图之文字渲染
2016/06/27 HTML / CSS
英国知名奢侈品包包品牌:Milli Millu
2016/12/22 全球购物
优秀少先队大队辅导员事迹材料
2014/05/04 职场文书
2014预防青少年违法犯罪工作总结
2014/12/10 职场文书
因身体原因离职的辞职信范文
2015/05/12 职场文书
浅谈Redis位图(Bitmap)及Redis二进制中的问题
2021/07/15 Redis
关于Vue中的options选项
2022/03/22 Vue.js