python urllib爬取百度云连接的实例代码


Posted in Python onJune 19, 2017

翻看自己以前写的程序,发现写过一个爬取盘多多百度云资源的东西,完全是当时想看变形金刚才自己写的,而且当时第一次接触python大概写了有2天才搞出来这个程序,学习python语言,可以看得出来那时候的代码写的真的low。虽然现在也不怎么样,哈哈,一直学习中,不做过多解释,上图上代码,因为变量的声明是什么我自己也忘了(手动傲娇),连写入文件当时都不会哈哈哈哈哈哈哈哈,也不知道class中可以通过init初始化,唉学习python原来我学到了这么多东西,感谢python

python urllib爬取百度云连接的实例代码

from bs4 import BeautifulSoup
import urllib
import requests
import re

adr =[]

''''对搜素资源名字进行url编码'''
search_text =raw_input('请输入搜索资源名:')
search_text = search_text.decode('gbk')
search_text = search_text.encode('utf-8')
search_text = urllib.quote(search_text)


''''获取文件地址'''
home = urllib.urlopen('http://www.panduoduo.net/s/name/'+search_text)


'''获取百度云地址'''
def getbaidu(adr):
  for i in adr:
    url = urllib.urlopen('http://www.panduoduo.net'+i)
    bs = BeautifulSoup(url)
    bs1 = bs.select('.dbutton2')
    href = re.compile('http\%(\%|\d|\w|\/\/|\/|\.)*')
    b = href.search(str(bs1))
    name = str(bs.select('.center')).decode('utf-8')
    text1 = re.compile('\<h1\sclass\=\"center"\>[\d|\w|\D|\W]*\</h1\>')
    text2 = text1.search(name)
    rag1 = re.compile('\>[\d|\w|\D|\W]*\<')
    if text2:
      text3 = rag1.search(text2.group())
      if text3:
        print text3.group()
    if b:
      text = urllib.unquote(str(b.group())).decode('utf-8')
      print text

'''初始化'''
def init(adr):
  soup = BeautifulSoup(home)
  soup = soup.select('.row')
  pattern = re.compile('\/r\/\d+')
  for i in soup:
    i = str(i)
    adress = pattern.search(i)
    adress = adress.group()
    adr.append(adress)


print 'running---------'    
init(adr)
getbaidu(adr)

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python发送邮件示例(支持中文邮件标题)
Feb 16 Python
编写Python脚本来实现最简单的FTP下载的教程
May 04 Python
Python中多线程的创建及基本调用方法
Jul 08 Python
Python爬取附近餐馆信息代码示例
Dec 09 Python
python实现淘宝秒杀聚划算抢购自动提醒源码
Jun 23 Python
代码分析Python地图坐标转换
Feb 08 Python
python opencv实现切变换 不裁减图片
Jul 26 Python
python将秒数转化为时间格式的实例
Sep 16 Python
Python对象转换为json的方法步骤
Apr 25 Python
浅析python,PyCharm,Anaconda三者之间的关系
Nov 27 Python
python代码实现将列表中重复元素之间的内容全部滤除
May 22 Python
Flask搭建一个API服务器的步骤
May 28 Python
Python的IDEL增加清屏功能实例
Jun 19 #Python
利用python爬取散文网的文章实例教程
Jun 18 #Python
Python3中简单的文件操作及两个简单小实例分享
Jun 18 #Python
python实现各进制转换的总结大全
Jun 18 #Python
Mac 上切换Python多版本
Jun 17 #Python
利用python实现xml与数据库读取转换的方法
Jun 17 #Python
用python写个自动SSH登录远程服务器的小工具(实例)
Jun 17 #Python
You might like
IIS下PHP连接数据库提示mysql undefined function mysql_connect()
2010/06/04 PHP
PHP实现异步调用方法研究与分享
2011/10/27 PHP
Yii框架实现邮箱激活的方法【数字签名】
2016/10/18 PHP
PHP中串行化用法示例
2016/11/16 PHP
Zend Framework分发器用法示例
2016/12/11 PHP
javascript 必知必会之closure
2009/09/21 Javascript
常用DOM整理
2015/06/16 Javascript
Bootstrap安装环境配置教程分享
2016/05/27 Javascript
JS正则RegExp.test()使用注意事项(不具有重复性)
2016/12/28 Javascript
关于Javascript中document.cookie的使用
2017/03/08 Javascript
vue.js 1.x与2.0中js实时监听input值的变化
2017/03/15 Javascript
JavaScript之Canvas_动力节点Java学院整理
2017/07/04 Javascript
解决webpack无法通过IP地址访问localhost的问题
2018/02/22 Javascript
Node.js进阶之核心模块https入门
2018/05/23 Javascript
vue使用video.js进行视频播放功能
2019/07/18 Javascript
微信小程序与公众号实现数据互通的方法
2019/07/25 Javascript
uni-app如何实现增量更新功能
2020/01/03 Javascript
[01:20:38]完美世界DOTA2联赛 GXR vs IO 第一场 11.07
2020/11/09 DOTA
对于Python中线程问题的简单讲解
2015/04/03 Python
淘宝秒杀python脚本 扫码登录版
2019/09/19 Python
Anaconda 查看、创建、管理和使用python环境的方法
2019/12/03 Python
CSS3制作炫酷带方向感应的鼠标滑过图片3D动画
2016/03/16 HTML / CSS
英国鞋类及配饰零售商:Kurt Geiger
2017/02/04 全球购物
Hotels.com日本:国外和海外住宿,酒店预订
2019/12/13 全球购物
C#中有没有运算符重载?能否使用指针?
2014/05/05 面试题
什么是Linux虚拟文件系统VFS
2012/01/31 面试题
如何提高MySql的安全性
2014/06/19 面试题
Java基础知识面试题
2014/03/25 面试题
旅游管理专业学生求职信
2013/09/28 职场文书
实习生自荐信范文
2013/11/13 职场文书
工程业务员岗位职责
2013/12/31 职场文书
高三语文教学反思
2014/01/15 职场文书
进步之星获奖感言
2014/02/22 职场文书
小区环境卫生倡议书
2015/04/29 职场文书
在CSS中映射鼠标位置并实现通过鼠标移动控制页面元素效果(实例代码)
2021/04/22 HTML / CSS
死磕 java同步系列之synchronized解析
2021/06/28 Java/Android