python urllib爬取百度云连接的实例代码


Posted in Python onJune 19, 2017

翻看自己以前写的程序,发现写过一个爬取盘多多百度云资源的东西,完全是当时想看变形金刚才自己写的,而且当时第一次接触python大概写了有2天才搞出来这个程序,学习python语言,可以看得出来那时候的代码写的真的low。虽然现在也不怎么样,哈哈,一直学习中,不做过多解释,上图上代码,因为变量的声明是什么我自己也忘了(手动傲娇),连写入文件当时都不会哈哈哈哈哈哈哈哈,也不知道class中可以通过init初始化,唉学习python原来我学到了这么多东西,感谢python

python urllib爬取百度云连接的实例代码

from bs4 import BeautifulSoup
import urllib
import requests
import re

adr =[]

''''对搜素资源名字进行url编码'''
search_text =raw_input('请输入搜索资源名:')
search_text = search_text.decode('gbk')
search_text = search_text.encode('utf-8')
search_text = urllib.quote(search_text)


''''获取文件地址'''
home = urllib.urlopen('http://www.panduoduo.net/s/name/'+search_text)


'''获取百度云地址'''
def getbaidu(adr):
  for i in adr:
    url = urllib.urlopen('http://www.panduoduo.net'+i)
    bs = BeautifulSoup(url)
    bs1 = bs.select('.dbutton2')
    href = re.compile('http\%(\%|\d|\w|\/\/|\/|\.)*')
    b = href.search(str(bs1))
    name = str(bs.select('.center')).decode('utf-8')
    text1 = re.compile('\<h1\sclass\=\"center"\>[\d|\w|\D|\W]*\</h1\>')
    text2 = text1.search(name)
    rag1 = re.compile('\>[\d|\w|\D|\W]*\<')
    if text2:
      text3 = rag1.search(text2.group())
      if text3:
        print text3.group()
    if b:
      text = urllib.unquote(str(b.group())).decode('utf-8')
      print text

'''初始化'''
def init(adr):
  soup = BeautifulSoup(home)
  soup = soup.select('.row')
  pattern = re.compile('\/r\/\d+')
  for i in soup:
    i = str(i)
    adress = pattern.search(i)
    adress = adress.group()
    adr.append(adress)


print 'running---------'    
init(adr)
getbaidu(adr)

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
深入解析Python中的descriptor描述器的作用及用法
Jun 27 Python
浅谈python for循环的巧妙运用(迭代、列表生成式)
Sep 26 Python
Python星号*与**用法分析
Feb 02 Python
基于pip install django失败时的解决方法
Jun 12 Python
Python Matplotlib实现三维数据的散点图绘制
Mar 19 Python
python 判断三个数字中的最大值实例代码
Jul 24 Python
解决Python对齐文本字符串问题
Aug 28 Python
使用pytorch完成kaggle猫狗图像识别方式
Jan 10 Python
用pytorch的nn.Module构造简单全链接层实例
Jan 14 Python
python网络编程:socketserver的基本使用方法实例分析
Apr 09 Python
Python3批量创建Crowd用户并分配组
May 20 Python
拒绝盗图!教你怎么用python给图片加水印
Jun 04 Python
Python的IDEL增加清屏功能实例
Jun 19 #Python
利用python爬取散文网的文章实例教程
Jun 18 #Python
Python3中简单的文件操作及两个简单小实例分享
Jun 18 #Python
python实现各进制转换的总结大全
Jun 18 #Python
Mac 上切换Python多版本
Jun 17 #Python
利用python实现xml与数据库读取转换的方法
Jun 17 #Python
用python写个自动SSH登录远程服务器的小工具(实例)
Jun 17 #Python
You might like
打造计数器DIY三步曲(上)
2006/10/09 PHP
一个SQL管理员的web接口
2006/10/09 PHP
PHP+javascript模拟Matrix画面
2006/10/09 PHP
php获取服务器操作系统相关信息的方法
2016/10/08 PHP
js限制文本框输入长度两种限制方式(长度、字节数)
2012/12/19 Javascript
利用JS解决ie6不支持max-width,max-height问题的方法
2014/01/02 Javascript
jQuery事件绑定和委托实例
2014/11/25 Javascript
jquery实现TAB选项卡鼠标经过带延迟效果的方法
2015/07/27 Javascript
JavaScript判断页面加载完之后再执行预定函数的技巧
2016/05/17 Javascript
Javascript使用function创建类的两种方法(推荐)
2016/11/19 Javascript
JavaScript实现事件的中断传播和行为阻止方法示例
2017/01/20 Javascript
vue 自定义组件 v-model双向绑定、 父子组件同步通信的多种写法
2017/11/27 Javascript
JS实现带导航城市列表以及输入搜索功能
2018/01/04 Javascript
讲解vue-router之什么是动态路由
2018/05/28 Javascript
微信小程序实现发送验证码按钮效果
2018/12/20 Javascript
Python字符串替换实例分析
2015/05/11 Python
python简单读取大文件的方法
2016/07/01 Python
基于ID3决策树算法的实现(Python版)
2017/05/31 Python
python感知机实现代码
2019/01/18 Python
python 设置输出图像的像素大小方法
2019/07/04 Python
python连接PostgreSQL数据库的过程详解
2019/09/18 Python
在Python 的线程中运行协程的方法
2020/02/24 Python
探秘TensorFlow 和 NumPy 的 Broadcasting 机制
2020/03/13 Python
Python爬虫爬取博客实现可视化过程解析
2020/06/29 Python
python 基于opencv 实现一个鼠标绘图小程序
2020/12/11 Python
英国时尚配饰、珠宝和服装网站:KJ Beckett
2020/01/23 全球购物
医院检讨书范文
2014/02/01 职场文书
天鹅的故事教学反思
2014/02/04 职场文书
《一个小村庄的故事》教学反思
2014/04/13 职场文书
空气的环保标语
2014/06/12 职场文书
社区关爱留守儿童活动方案
2014/08/22 职场文书
室内趣味活动方案
2014/08/24 职场文书
《刷子李》教学反思
2016/02/20 职场文书
2017新年晚会开幕词
2016/03/03 职场文书
Python实现视频自动打码的示例代码
2022/04/08 Python
Java 写一个简单的图书管理系统
2022/04/26 Java/Android