编程 Python

python urllib爬取百度云连接的实例代码

Posted in Python onJune 19, 2017

翻看自己以前写的程序，发现写过一个爬取盘多多百度云资源的东西，完全是当时想看变形金刚才自己写的，而且当时第一次接触python大概写了有2天才搞出来这个程序，学习python语言，可以看得出来那时候的代码写的真的low。虽然现在也不怎么样，哈哈，一直学习中，不做过多解释，上图上代码，因为变量的声明是什么我自己也忘了（手动傲娇），连写入文件当时都不会哈哈哈哈哈哈哈哈，也不知道class中可以通过init初始化，唉学习python原来我学到了这么多东西，感谢python

from bs4 import BeautifulSoup
import urllib
import requests
import re

adr =[]

''''对搜素资源名字进行url编码'''
search_text =raw_input('请输入搜索资源名：')
search_text = search_text.decode('gbk')
search_text = search_text.encode('utf-8')
search_text = urllib.quote(search_text)


''''获取文件地址'''
home = urllib.urlopen('http://www.panduoduo.net/s/name/'+search_text)


'''获取百度云地址'''
def getbaidu(adr):
  for i in adr:
    url = urllib.urlopen('http://www.panduoduo.net'+i)
    bs = BeautifulSoup(url)
    bs1 = bs.select('.dbutton2')
    href = re.compile('http\%(\%|\d|\w|\/\/|\/|\.)*')
    b = href.search(str(bs1))
    name = str(bs.select('.center')).decode('utf-8')
    text1 = re.compile('\<h1\sclass\=\"center"\>[\d|\w|\D|\W]*\</h1\>')
    text2 = text1.search(name)
    rag1 = re.compile('\>[\d|\w|\D|\W]*\<')
    if text2:
      text3 = rag1.search(text2.group())
      if text3:
        print text3.group()
    if b:
      text = urllib.unquote(str(b.group())).decode('utf-8')
      print text

'''初始化'''
def init(adr):
  soup = BeautifulSoup(home)
  soup = soup.select('.row')
  pattern = re.compile('\/r\/\d+')
  for i in soup:
    i = str(i)
    adress = pattern.search(i)
    adress = adress.group()
    adr.append(adress)


print 'running---------'    
init(adr)
getbaidu(adr)

以上就是本文的全部内容，希望对大家的学习有所帮助，也希望大家多多支持三水点靠木。

python urllib爬取百度云连接的实例代码

- Author -

baddog_

声明：登载此文出于传递更多信息之目的，并不意味着赞同其观点或证实其描述。

Python 相关文章推荐

深入解析Python中的descriptor描述器的作用及用法

Jun 27 Python

浅谈python for循环的巧妙运用(迭代、列表生成式)

Sep 26 Python

Python星号*与**用法分析

Feb 02 Python

基于pip install django失败时的解决方法

Jun 12 Python

Python Matplotlib实现三维数据的散点图绘制

Mar 19 Python

python 判断三个数字中的最大值实例代码

Jul 24 Python

解决Python对齐文本字符串问题

Aug 28 Python

使用pytorch完成kaggle猫狗图像识别方式

Jan 10 Python

用pytorch的nn.Module构造简单全链接层实例

Jan 14 Python

python网络编程：socketserver的基本使用方法实例分析

Apr 09 Python

Python3批量创建Crowd用户并分配组

May 20 Python

拒绝盗图!教你怎么用python给图片加水印

Jun 04 Python

Python的IDEL增加清屏功能实例

Jun 19 #Python

利用python爬取散文网的文章实例教程

Jun 18 #Python

Python3中简单的文件操作及两个简单小实例分享

Jun 18 #Python

python实现各进制转换的总结大全

Jun 18 #Python

Mac 上切换Python多版本

Jun 17 #Python

利用python实现xml与数据库读取转换的方法

Jun 17 #Python

用python写个自动SSH登录远程服务器的小工具(实例)

Jun 17 #Python

You might like

打造计数器DIY三步曲(上)

2006/10/09 PHP

一个SQL管理员的web接口

2006/10/09 PHP

PHP+javascript模拟Matrix画面

2006/10/09 PHP

php获取服务器操作系统相关信息的方法

2016/10/08 PHP

js限制文本框输入长度两种限制方式(长度、字节数)

2012/12/19 Javascript

利用JS解决ie6不支持max-width,max-height问题的方法

2014/01/02 Javascript

jQuery事件绑定和委托实例

2014/11/25 Javascript

jquery实现TAB选项卡鼠标经过带延迟效果的方法

2015/07/27 Javascript

JavaScript判断页面加载完之后再执行预定函数的技巧

2016/05/17 Javascript

Javascript使用function创建类的两种方法(推荐)

2016/11/19 Javascript

JavaScript实现事件的中断传播和行为阻止方法示例

2017/01/20 Javascript

vue 自定义组件 v-model双向绑定、父子组件同步通信的多种写法

2017/11/27 Javascript

JS实现带导航城市列表以及输入搜索功能

2018/01/04 Javascript

讲解vue-router之什么是动态路由

2018/05/28 Javascript

微信小程序实现发送验证码按钮效果

2018/12/20 Javascript

Python字符串替换实例分析

2015/05/11 Python

python简单读取大文件的方法

2016/07/01 Python

基于ID3决策树算法的实现(Python版)

2017/05/31 Python

python感知机实现代码

2019/01/18 Python

python 设置输出图像的像素大小方法

2019/07/04 Python

python连接PostgreSQL数据库的过程详解

2019/09/18 Python

在Python 的线程中运行协程的方法

2020/02/24 Python

探秘TensorFlow 和 NumPy 的 Broadcasting 机制

2020/03/13 Python

Python爬虫爬取博客实现可视化过程解析

2020/06/29 Python

python 基于opencv 实现一个鼠标绘图小程序

2020/12/11 Python

英国时尚配饰、珠宝和服装网站：KJ Beckett

2020/01/23 全球购物

医院检讨书范文

2014/02/01 职场文书

天鹅的故事教学反思

2014/02/04 职场文书

《一个小村庄的故事》教学反思

2014/04/13 职场文书

空气的环保标语

2014/06/12 职场文书

社区关爱留守儿童活动方案

2014/08/22 职场文书

室内趣味活动方案

2014/08/24 职场文书

《刷子李》教学反思

2016/02/20 职场文书

2017新年晚会开幕词

2016/03/03 职场文书

Python实现视频自动打码的示例代码

2022/04/08 Python

Java 写一个简单的图书管理系统

2022/04/26 Java/Android