Python解析网页源代码中的115网盘链接实例


Posted in Python onSeptember 30, 2014

本文实例讲述了python解析网页源代码中的115网盘链接的方法。分享给大家供大家参考。具体方法分析如下:

其中的1.txt,是网页http://bbs.pediy.com/showthread.php?t=144788另存为1.txt

具体代码如下:

import re 
   
if __name__ == "__main__": 
  fp = open("c:\\1.txt") 
   
  https = re.compile(r"(http://u.*)") 
  for url in https.findall(fp.read()): 
    print url

输出结果:

http://u.115.com/file/f61cb107c8 
http://u.115.com/file/f6806f45b8 
http://u.115.com/file/f6ec42d4d3 
http://u.115.com/file/f6deb05ec4 
http://u.115.com/file/f6e51f6838 
http://u.115.com/file/f66edaf8d3  
http://u.115.com/file/f6d07e07b9 
http://u.115.com/file/f6d7f585a8 
http://u.115.com/file/f639d8b3cf 
http://u.115.com/file/f6dcadbde6 
http://u.115.com/file/f6ea3f01c1 
http://u.115.com/file/f65b96a06f  
http://u.115.com/file/f682da085a  
http://u.115.com/file/f6486e698 
http://u.115.com/file/f6b7491d9f 
http://u.115.com/file/f622b7f9a7 
http://u.115.com/file/f64e2424b9 
http://u.115.com/file/f6e5132d4d  
http://u.115.com/file/f655c10e86  
http://u.115.com/file/f6b22e64e6 
http://u.115.com/file/f6812126a4  
http://u.115.com/file/f6523e625c 
http://u.115.com/file/f63e0ccb28 
http://u.115.com/file/f611e07b8a# 
http://u.115.com/file/f6e047bccc#  
http://u.115.com/file/f6d348d781# 
http://u.115.com/file/f6ada24153# 
http://u.115.com/file/f64f97518b#  
http://u.115.com/file/f6f9ba96f8# 
http://u.115.com/file/f650e06f38# 
http://u.115.com/file/f683ee5b2a# 
http://u.115.com/file/f69009bfc2# 
http://u.115.com/file/f6ea427646# 
http://u.115.com/file/f6acdc6b7f# 
http://u.115.com/file/f6c85745d0# 
http://u.115.com/file/f61a26cf12# 
http://u.115.com/file/f631edf5c6#  
http://u.115.com/file/f6b0fa6fb8# 
http://u.115.com/file/f6f5fe8962# 
http://u.115.com/file/f6bf975e0#  
http://u.115.com/file/f6d522784c#  
http://u.115.com/file/f6b5ac9991#  
http://u.115.com/file/f62e80ced5#  
http://u.115.com/file/f6bff09c0c#  
http://u.115.com/file/f663fc4a54# 
http://u.115.com/file/blpk4pv1 
http://u.115.com/file/c4rjotdz 
http://u.115.com/file/f6a960aca8# 
http://u.115.com/file/efnn38jr 
http://u.115.com/file/c4leomjd 
http://u.115.com/file/dlpw9s6i 
http://u.115.com/file/f6d3cbebe0# 
http://u.115.com/file/f6de8062b2# 
http://u.115.com/file/ef8og8la 
http://u.115.com/file/f6f6391ac6# 
http://u.115.com/file/f628d256ae# 
http://u.115.com/file/f66a049dc9# 
http://u.115.com/file/f62bf1750a# 
http://u.115.com/file/f642e47260# 
http://u.115.com/file/f693eb7c89# 
http://u.115.com/file/f6ed68ba9b# 
http://u.115.com/file/f6f099c3f9# 
http://u.115.com/file/f61ac19339# 
http://u.115.com/file/f6f3c78d2c# 
http://u.115.com/file/f6696f6348# 
http://u.115.com/file/f6e88eeefb# 
http://u.115.com/file/f66471e4eb# 
http://u.115.com/file/f672da54ae# 
http://u.115.com/file/dnasw0kp# 
http://u.115.com/file/dnagnndx# 
http://u.115.com/file/clwr2xxg# 
http://u.115.com/file/bhbcnnwe# 
http://u.115.com/file/aq2rp9ga# 
http://u.115.com/file/e601turs# 
http://u.115.com/file/dn46qs7x# 
http://u.115.com/file/clwonrwg# 
http://u.115.com/file/dn43i7jf# 
http://u.115.com/file/bhbgrnfz# 
http://u.115.com/file/dnsl0kxp#

希望本文所述对大家的Python程序设计有所帮助

Python 相关文章推荐
Python  连接字符串(join %)
Sep 06 Python
python创建和删除目录的方法
Apr 29 Python
详解Python中的__getitem__方法与slice对象的切片操作
Jun 27 Python
Python切换pip安装源的方法详解
Nov 18 Python
Python基于tkinter模块实现的改名小工具示例
Jul 27 Python
Python 3.6 性能测试框架Locust安装及使用方法(详解)
Oct 11 Python
Python将多个excel表格合并为一个表格
Feb 22 Python
Python中安装easy_install的方法
Nov 18 Python
python 实现调用子文件下的模块方法
Dec 07 Python
详解使用django-mama-cas快速搭建CAS服务的实现
Oct 30 Python
python通过matplotlib生成复合饼图
Feb 06 Python
Python工程师必考的6个经典面试题
Jun 28 Python
python网络编程之读取网站根目录实例
Sep 30 #Python
python中sets模块的用法实例
Sep 30 #Python
python根据路径导入模块的方法
Sep 30 #Python
python基于xml parse实现解析cdatasection数据
Sep 30 #Python
python中ConfigParse模块的用法
Sep 29 #Python
Python中logging模块的用法实例
Sep 29 #Python
Python基于twisted实现简单的web服务器
Sep 29 #Python
You might like
超强分页类2.0发布,支持自定义风格,默认4种显示模式
2007/01/02 PHP
php读取文件内容至字符串中,同时去除换行、空行、行首行尾空格(Zjmainstay原创)
2012/07/31 PHP
PHP、Java des加密解密实例
2015/04/27 PHP
详解PHP错误日志的获取方法
2015/07/20 PHP
为何说PHP引用是个坑,要慎用
2018/04/02 PHP
PHP抽象类和接口用法实例详解
2019/07/20 PHP
国外的为初学者写的JavaScript教程
2008/06/09 Javascript
asp批量修改记录的代码
2008/06/25 Javascript
浅谈jQuery中对象遍历.eq().first().last().slice()方法
2014/11/26 Javascript
JS图片预加载插件详解
2017/06/21 Javascript
javascript浏览器用户代理检测脚本实现方法
2017/10/27 Javascript
jQuery替换节点元素的操作方法
2018/03/18 jQuery
Vue keepAlive 数据缓存工具实现返回上一个页面浏览的位置
2019/05/10 Javascript
JavaScript面向对象编程小游戏---贪吃蛇代码实例
2019/05/15 Javascript
js实现购物车商品数量加减
2020/09/21 Javascript
[41:12]Liquid vs Secret 2019国际邀请赛淘汰赛 败者组 BO3 第一场 8.24
2019/09/10 DOTA
python根据距离和时长计算配速示例
2014/02/16 Python
python实现根据窗口标题调用窗口的方法
2015/03/13 Python
Python基于回溯法子集树模板解决0-1背包问题实例
2017/09/02 Python
Python爬虫beautifulsoup4常用的解析方法总结
2019/02/25 Python
python 环境搭建 及python-3.4.4的下载和安装过程
2019/07/20 Python
Python计算指定日期是今年的第几天(三种方法)
2020/03/26 Python
python和pywin32实现窗口查找、遍历和点击的示例代码
2020/04/01 Python
Spring @Enable模块驱动原理及使用实例
2020/06/23 Python
解决python 执行shell命令无法获取返回值的问题
2020/12/05 Python
用Python自动清理电脑内重复文件,只要10行代码(自动脚本)
2021/01/09 Python
恐龙的灭绝教学反思
2014/02/12 职场文书
幼儿园教师的考核评语
2014/04/18 职场文书
代办委托书怎么写
2014/08/01 职场文书
2014公安机关纪律作风整顿思想汇报
2014/09/13 职场文书
2014第二批党员干部对照“四风”找差距检查材料思想汇报
2014/09/18 职场文书
党员民主评议个人总结
2014/10/20 职场文书
单位作风建设自查报告
2014/10/23 职场文书
2014年稽查工作总结
2014/12/20 职场文书
高考百日冲刺决心书
2015/09/23 职场文书
读《工匠精神》有感:热爱工作,精益求精
2019/12/28 职场文书