python urllib爬取百度云连接的实例代码


Posted in Python onJune 19, 2017

翻看自己以前写的程序,发现写过一个爬取盘多多百度云资源的东西,完全是当时想看变形金刚才自己写的,而且当时第一次接触python大概写了有2天才搞出来这个程序,学习python语言,可以看得出来那时候的代码写的真的low。虽然现在也不怎么样,哈哈,一直学习中,不做过多解释,上图上代码,因为变量的声明是什么我自己也忘了(手动傲娇),连写入文件当时都不会哈哈哈哈哈哈哈哈,也不知道class中可以通过init初始化,唉学习python原来我学到了这么多东西,感谢python

python urllib爬取百度云连接的实例代码

from bs4 import BeautifulSoup
import urllib
import requests
import re

adr =[]

''''对搜素资源名字进行url编码'''
search_text =raw_input('请输入搜索资源名:')
search_text = search_text.decode('gbk')
search_text = search_text.encode('utf-8')
search_text = urllib.quote(search_text)


''''获取文件地址'''
home = urllib.urlopen('http://www.panduoduo.net/s/name/'+search_text)


'''获取百度云地址'''
def getbaidu(adr):
  for i in adr:
    url = urllib.urlopen('http://www.panduoduo.net'+i)
    bs = BeautifulSoup(url)
    bs1 = bs.select('.dbutton2')
    href = re.compile('http\%(\%|\d|\w|\/\/|\/|\.)*')
    b = href.search(str(bs1))
    name = str(bs.select('.center')).decode('utf-8')
    text1 = re.compile('\<h1\sclass\=\"center"\>[\d|\w|\D|\W]*\</h1\>')
    text2 = text1.search(name)
    rag1 = re.compile('\>[\d|\w|\D|\W]*\<')
    if text2:
      text3 = rag1.search(text2.group())
      if text3:
        print text3.group()
    if b:
      text = urllib.unquote(str(b.group())).decode('utf-8')
      print text

'''初始化'''
def init(adr):
  soup = BeautifulSoup(home)
  soup = soup.select('.row')
  pattern = re.compile('\/r\/\d+')
  for i in soup:
    i = str(i)
    adress = pattern.search(i)
    adress = adress.group()
    adr.append(adress)


print 'running---------'    
init(adr)
getbaidu(adr)

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
在Django中限制已登录用户的访问的方法
Jul 23 Python
python用户管理系统的实例讲解
Dec 23 Python
Python 删除整个文本中的空格,并实现按行显示
Jul 24 Python
解决python xlrd无法读取excel文件的问题
Dec 25 Python
Python3 修改默认环境的方法
Feb 16 Python
python flask安装和命令详解
Apr 02 Python
详解python websocket获取实时数据的几种常见链接方式
Jul 01 Python
Python实现朴素贝叶斯的学习与分类过程解析
Aug 24 Python
工程师必须了解的LRU缓存淘汰算法以及python实现过程
Oct 15 Python
python实战之用emoji表情生成文字
May 08 Python
Python Flask搭建yolov3目标检测系统详解流程
Nov 07 Python
Python Django项目和应用的创建详解
Nov 27 Python
Python的IDEL增加清屏功能实例
Jun 19 #Python
利用python爬取散文网的文章实例教程
Jun 18 #Python
Python3中简单的文件操作及两个简单小实例分享
Jun 18 #Python
python实现各进制转换的总结大全
Jun 18 #Python
Mac 上切换Python多版本
Jun 17 #Python
利用python实现xml与数据库读取转换的方法
Jun 17 #Python
用python写个自动SSH登录远程服务器的小工具(实例)
Jun 17 #Python
You might like
php版本的cron定时任务执行器使用实例
2014/08/19 PHP
PHP数组和explode函数示例总结
2015/05/08 PHP
PHP中is_dir()函数使用指南
2015/05/08 PHP
php基于jquery的ajax技术传递json数据简单实例
2016/04/15 PHP
如何解决PHP获取不到SESSION信息之一般情况
2019/10/10 PHP
[原创]后缀就扩展名为js的文件是什么文件
2007/12/06 Javascript
用jQuery简化JavaScript开发分析
2009/02/19 Javascript
javascript中字符串替换函数replace()方法与c# 、vb 替换有一点不同
2010/06/25 Javascript
Javascript实现简单的富文本编辑器附演示
2014/06/16 Javascript
javascript实现类似于新浪微博搜索框弹出效果的方法
2015/07/27 Javascript
Node.js环境下JavaScript实现单链表与双链表结构
2016/06/12 Javascript
Vue数据驱动模拟实现1
2017/01/11 Javascript
浅谈Vue路由快照实现思路及其问题
2018/06/07 Javascript
vue中使用heatmapjs的示例代码(结合百度地图)
2018/09/05 Javascript
Vue CLI 3.x 自动部署项目至服务器的方法
2019/04/02 Javascript
详解vue使用$http服务端收不到参数
2019/04/19 Javascript
微信小程序实现页面浮动导航
2020/01/08 Javascript
ES6学习笔记之字符串、数组、对象、函数新增知识点实例分析
2020/01/22 Javascript
windows下create-react-app 升级至3.3.1版本踩坑记
2020/02/17 Javascript
把MySQL表结构映射为Python中的对象的教程
2015/04/07 Python
简单说明Python中的装饰器的用法
2015/04/24 Python
简单的python后台管理程序
2017/04/13 Python
Python列表切片用法示例
2017/04/19 Python
Python第三方包之DingDingBot钉钉机器人
2020/04/09 Python
keras K.function获取某层的输出操作
2020/06/29 Python
实现CSS3中的border-radius(边框圆角)示例代码
2013/07/19 HTML / CSS
北美Newegg打造的全球尖货海购平台:tt海购
2018/09/28 全球购物
英国顶级足球鞋的领先零售商:Lovell Soccer
2019/08/27 全球购物
工程预算与管理应届生求职信
2013/10/06 职场文书
医学专业五年以上个人求职信
2013/12/03 职场文书
小学校园活动策划
2014/01/30 职场文书
教师简历自我评价
2014/02/03 职场文书
文明礼仪伴我行演讲稿
2014/05/12 职场文书
装修活动策划方案
2014/08/27 职场文书
网络舆情信息简报
2015/07/21 职场文书
2015年度工程师评职称工作总结
2015/10/14 职场文书