python urllib爬取百度云连接的实例代码


Posted in Python onJune 19, 2017

翻看自己以前写的程序,发现写过一个爬取盘多多百度云资源的东西,完全是当时想看变形金刚才自己写的,而且当时第一次接触python大概写了有2天才搞出来这个程序,学习python语言,可以看得出来那时候的代码写的真的low。虽然现在也不怎么样,哈哈,一直学习中,不做过多解释,上图上代码,因为变量的声明是什么我自己也忘了(手动傲娇),连写入文件当时都不会哈哈哈哈哈哈哈哈,也不知道class中可以通过init初始化,唉学习python原来我学到了这么多东西,感谢python

python urllib爬取百度云连接的实例代码

from bs4 import BeautifulSoup
import urllib
import requests
import re

adr =[]

''''对搜素资源名字进行url编码'''
search_text =raw_input('请输入搜索资源名:')
search_text = search_text.decode('gbk')
search_text = search_text.encode('utf-8')
search_text = urllib.quote(search_text)


''''获取文件地址'''
home = urllib.urlopen('http://www.panduoduo.net/s/name/'+search_text)


'''获取百度云地址'''
def getbaidu(adr):
  for i in adr:
    url = urllib.urlopen('http://www.panduoduo.net'+i)
    bs = BeautifulSoup(url)
    bs1 = bs.select('.dbutton2')
    href = re.compile('http\%(\%|\d|\w|\/\/|\/|\.)*')
    b = href.search(str(bs1))
    name = str(bs.select('.center')).decode('utf-8')
    text1 = re.compile('\<h1\sclass\=\"center"\>[\d|\w|\D|\W]*\</h1\>')
    text2 = text1.search(name)
    rag1 = re.compile('\>[\d|\w|\D|\W]*\<')
    if text2:
      text3 = rag1.search(text2.group())
      if text3:
        print text3.group()
    if b:
      text = urllib.unquote(str(b.group())).decode('utf-8')
      print text

'''初始化'''
def init(adr):
  soup = BeautifulSoup(home)
  soup = soup.select('.row')
  pattern = re.compile('\/r\/\d+')
  for i in soup:
    i = str(i)
    adress = pattern.search(i)
    adress = adress.group()
    adr.append(adress)


print 'running---------'    
init(adr)
getbaidu(adr)

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python程序设计入门(2)变量类型简介
Jun 16 Python
如何处理Python3.4 使用pymssql 乱码问题
Jan 08 Python
Python实现从log日志中提取ip的方法【正则提取】
Mar 31 Python
python判断列表的连续数字范围并分块的方法
Nov 16 Python
一篇文章弄懂Python中所有数组数据类型
Jun 23 Python
使用Pandas对数据进行筛选和排序的实现
Jul 29 Python
如何运行带参数的python脚本
Nov 15 Python
pytorch载入预训练模型后,实现训练指定层
Jan 06 Python
python GUI库图形界面开发之PyQt5图片显示控件QPixmap详细使用方法与实例
Feb 27 Python
Python爬虫爬取百度搜索内容代码实例
Jun 05 Python
Django配置Bootstrap, js实现过程详解
Oct 13 Python
详解Python 中的 defaultdict 数据类型
Feb 22 Python
Python的IDEL增加清屏功能实例
Jun 19 #Python
利用python爬取散文网的文章实例教程
Jun 18 #Python
Python3中简单的文件操作及两个简单小实例分享
Jun 18 #Python
python实现各进制转换的总结大全
Jun 18 #Python
Mac 上切换Python多版本
Jun 17 #Python
利用python实现xml与数据库读取转换的方法
Jun 17 #Python
用python写个自动SSH登录远程服务器的小工具(实例)
Jun 17 #Python
You might like
使用网络地址转换实现多服务器负载均衡
2006/10/09 PHP
模仿OSO的论坛(四)
2006/10/09 PHP
浅析php中jsonp的跨域实例
2013/06/21 PHP
浅谈json_encode用法
2015/03/05 PHP
PHP定义字符串的四种方式详解
2018/02/06 PHP
使用composer安装使用thinkphp6.0框架问题【视频教程】
2019/10/01 PHP
Cookie 注入是怎样产生的
2009/04/08 Javascript
jquery validation验证身份证号,护照,电话号码,email(实例代码)
2013/11/06 Javascript
jQuery$命名冲突怎么办如何解决
2014/01/16 Javascript
javascript为下拉列表动态添加数据项
2014/05/23 Javascript
详解Bootstrap创建表单的三种格式(一)
2016/01/04 Javascript
详解前端构建工具gulpjs的使用介绍及技巧
2017/01/19 Javascript
JS原生轮播图的简单实现(推荐)
2017/07/22 Javascript
vue仿淘宝订单状态的tab切换效果
2020/06/23 Javascript
详解auto-vue-file:一个自动创建vue组件的包
2019/04/26 Javascript
简单了解Javscript中兄弟ifream的方法调用
2019/06/17 Javascript
如何基于javascript实现贪吃蛇游戏
2020/02/09 Javascript
python计算一个序列的平均值的方法
2015/07/11 Python
Python Json序列化与反序列化的示例
2018/01/31 Python
python使用epoll实现服务端的方法
2018/10/16 Python
Python 从相对路径下import的方法
2018/12/04 Python
python networkx 根据图的权重画图实现
2019/07/10 Python
python模块和包的应用BASE_PATH使用解析
2019/12/14 Python
洛杉矶生活休闲而精致的基础品牌:Mika Jaymes
2018/01/07 全球购物
波兰最大的度假胜地和城市公寓租赁运营商:Sun & Snow
2018/10/18 全球购物
马来西亚最大的在线隐形眼镜商店:MrLens
2019/03/27 全球购物
高中毕业生自我鉴定
2013/11/03 职场文书
土建专业毕业生自荐书
2014/07/04 职场文书
职业道德模范事迹材料
2014/08/24 职场文书
2014物价局民主生活会对照检查材料思想汇报
2014/09/24 职场文书
财务整改报告范文
2014/11/05 职场文书
2014年志愿者工作总结
2014/11/20 职场文书
工作收入证明范本
2015/06/12 职场文书
职工食堂管理制度
2015/08/06 职场文书
PHP判断是否是json字符串
2021/04/01 PHP
Python列表删除重复元素与图像相似度判断及删除实例代码
2021/05/07 Python