Python解析网页源代码中的115网盘链接实例


Posted in Python onSeptember 30, 2014

本文实例讲述了python解析网页源代码中的115网盘链接的方法。分享给大家供大家参考。具体方法分析如下:

其中的1.txt,是网页http://bbs.pediy.com/showthread.php?t=144788另存为1.txt

具体代码如下:

import re 
   
if __name__ == "__main__": 
  fp = open("c:\\1.txt") 
   
  https = re.compile(r"(http://u.*)") 
  for url in https.findall(fp.read()): 
    print url

输出结果:

http://u.115.com/file/f61cb107c8 
http://u.115.com/file/f6806f45b8 
http://u.115.com/file/f6ec42d4d3 
http://u.115.com/file/f6deb05ec4 
http://u.115.com/file/f6e51f6838 
http://u.115.com/file/f66edaf8d3  
http://u.115.com/file/f6d07e07b9 
http://u.115.com/file/f6d7f585a8 
http://u.115.com/file/f639d8b3cf 
http://u.115.com/file/f6dcadbde6 
http://u.115.com/file/f6ea3f01c1 
http://u.115.com/file/f65b96a06f  
http://u.115.com/file/f682da085a  
http://u.115.com/file/f6486e698 
http://u.115.com/file/f6b7491d9f 
http://u.115.com/file/f622b7f9a7 
http://u.115.com/file/f64e2424b9 
http://u.115.com/file/f6e5132d4d  
http://u.115.com/file/f655c10e86  
http://u.115.com/file/f6b22e64e6 
http://u.115.com/file/f6812126a4  
http://u.115.com/file/f6523e625c 
http://u.115.com/file/f63e0ccb28 
http://u.115.com/file/f611e07b8a# 
http://u.115.com/file/f6e047bccc#  
http://u.115.com/file/f6d348d781# 
http://u.115.com/file/f6ada24153# 
http://u.115.com/file/f64f97518b#  
http://u.115.com/file/f6f9ba96f8# 
http://u.115.com/file/f650e06f38# 
http://u.115.com/file/f683ee5b2a# 
http://u.115.com/file/f69009bfc2# 
http://u.115.com/file/f6ea427646# 
http://u.115.com/file/f6acdc6b7f# 
http://u.115.com/file/f6c85745d0# 
http://u.115.com/file/f61a26cf12# 
http://u.115.com/file/f631edf5c6#  
http://u.115.com/file/f6b0fa6fb8# 
http://u.115.com/file/f6f5fe8962# 
http://u.115.com/file/f6bf975e0#  
http://u.115.com/file/f6d522784c#  
http://u.115.com/file/f6b5ac9991#  
http://u.115.com/file/f62e80ced5#  
http://u.115.com/file/f6bff09c0c#  
http://u.115.com/file/f663fc4a54# 
http://u.115.com/file/blpk4pv1 
http://u.115.com/file/c4rjotdz 
http://u.115.com/file/f6a960aca8# 
http://u.115.com/file/efnn38jr 
http://u.115.com/file/c4leomjd 
http://u.115.com/file/dlpw9s6i 
http://u.115.com/file/f6d3cbebe0# 
http://u.115.com/file/f6de8062b2# 
http://u.115.com/file/ef8og8la 
http://u.115.com/file/f6f6391ac6# 
http://u.115.com/file/f628d256ae# 
http://u.115.com/file/f66a049dc9# 
http://u.115.com/file/f62bf1750a# 
http://u.115.com/file/f642e47260# 
http://u.115.com/file/f693eb7c89# 
http://u.115.com/file/f6ed68ba9b# 
http://u.115.com/file/f6f099c3f9# 
http://u.115.com/file/f61ac19339# 
http://u.115.com/file/f6f3c78d2c# 
http://u.115.com/file/f6696f6348# 
http://u.115.com/file/f6e88eeefb# 
http://u.115.com/file/f66471e4eb# 
http://u.115.com/file/f672da54ae# 
http://u.115.com/file/dnasw0kp# 
http://u.115.com/file/dnagnndx# 
http://u.115.com/file/clwr2xxg# 
http://u.115.com/file/bhbcnnwe# 
http://u.115.com/file/aq2rp9ga# 
http://u.115.com/file/e601turs# 
http://u.115.com/file/dn46qs7x# 
http://u.115.com/file/clwonrwg# 
http://u.115.com/file/dn43i7jf# 
http://u.115.com/file/bhbgrnfz# 
http://u.115.com/file/dnsl0kxp#

希望本文所述对大家的Python程序设计有所帮助

Python 相关文章推荐
深入分析在Python模块顶层运行的代码引起的一个Bug
Jul 04 Python
python黑魔法之参数传递
Feb 12 Python
使用py2exe在Windows下将Python程序转为exe文件
Mar 04 Python
python 安装virtualenv和virtualenvwrapper的方法
Jan 13 Python
Django添加feeds功能的示例
Aug 07 Python
python mac下安装虚拟环境的图文教程
Apr 12 Python
Python中list的交、并、差集获取方法示例
Aug 01 Python
ubuntu上安装python的实例方法
Sep 30 Python
TensorFlow-gpu和opencv安装详细教程
Jun 30 Python
python用Tkinter做自己的中文代码编辑器
Sep 07 Python
详解Django ORM引发的数据库N+1性能问题
Oct 12 Python
详解利用python识别图片中的条码(pyzbar)及条码图片矫正和增强
Nov 17 Python
python网络编程之读取网站根目录实例
Sep 30 #Python
python中sets模块的用法实例
Sep 30 #Python
python根据路径导入模块的方法
Sep 30 #Python
python基于xml parse实现解析cdatasection数据
Sep 30 #Python
python中ConfigParse模块的用法
Sep 29 #Python
Python中logging模块的用法实例
Sep 29 #Python
Python基于twisted实现简单的web服务器
Sep 29 #Python
You might like
php图片的裁剪与缩放生成符合需求的缩略图
2013/01/11 PHP
理解PHP中的stdClass类
2014/04/18 PHP
PHP易混淆函数的区别及用法汇总
2014/11/22 PHP
浅谈php提交form表单
2015/07/01 PHP
CI框架整合smarty步骤详解
2016/05/19 PHP
PHP通过bypass disable functions执行系统命令的方法汇总
2018/05/02 PHP
Jquery 滑入滑出效果实现代码
2010/03/27 Javascript
一个报数游戏js版(约瑟夫环问题)
2010/08/05 Javascript
javascript中onmouse事件在div中失效问题的解决方法
2012/01/09 Javascript
jquery easyui使用心得
2014/07/07 Javascript
jquery控制表单输入框显示默认值的方法
2015/05/22 Javascript
JS+CSS实现带有碰撞缓冲效果的竖向导航条代码
2015/09/15 Javascript
jQuery使用contains过滤器实现精确匹配方法详解
2016/02/25 Javascript
jquery实现点击页面回到顶部
2016/11/23 Javascript
JS+Ajax实现百度智能搜索框
2017/08/04 Javascript
JavaScript基础进阶之数组方法总结(推荐)
2017/09/04 Javascript
VUE2实现事件驱动弹窗示例
2017/10/21 Javascript
Node.js实现mysql连接池使用事务自动回收连接的方法示例
2018/02/03 Javascript
ajax请求+vue.js渲染+页面加载的示例
2018/02/11 Javascript
vue elementui tree 任意级别拖拽功能代码
2020/08/31 Javascript
Nuxt pages下不同的页面对应layout下的页面布局操作
2020/11/05 Javascript
JavaScript实现通讯录功能
2020/12/27 Javascript
Python中编写ORM框架的入门指引
2015/04/29 Python
Django中对通过测试的用户进行限制访问的方法
2015/07/23 Python
Python实现约瑟夫环问题的方法
2016/05/03 Python
python2.7实现邮件发送功能
2018/12/12 Python
浅谈PYTHON 关于文件的操作
2019/03/19 Python
python实现把二维列表变为一维列表的方法分析
2019/10/08 Python
TensorFlow实现批量归一化操作的示例
2020/04/22 Python
爬虫代理的cookie如何生成运行
2020/09/22 Python
pycharm进入时每次都是insert模式的解决方式
2021/02/05 Python
基于css3仿造window7的开始菜单
2010/06/17 HTML / CSS
幼教个人求职信范文
2013/12/02 职场文书
2016自主招生校长推荐信范文
2015/03/23 职场文书
党员电教片《信仰》心得体会
2016/01/15 职场文书