python urllib爬取百度云连接的实例代码


Posted in Python onJune 19, 2017

翻看自己以前写的程序,发现写过一个爬取盘多多百度云资源的东西,完全是当时想看变形金刚才自己写的,而且当时第一次接触python大概写了有2天才搞出来这个程序,学习python语言,可以看得出来那时候的代码写的真的low。虽然现在也不怎么样,哈哈,一直学习中,不做过多解释,上图上代码,因为变量的声明是什么我自己也忘了(手动傲娇),连写入文件当时都不会哈哈哈哈哈哈哈哈,也不知道class中可以通过init初始化,唉学习python原来我学到了这么多东西,感谢python

python urllib爬取百度云连接的实例代码

from bs4 import BeautifulSoup
import urllib
import requests
import re

adr =[]

''''对搜素资源名字进行url编码'''
search_text =raw_input('请输入搜索资源名:')
search_text = search_text.decode('gbk')
search_text = search_text.encode('utf-8')
search_text = urllib.quote(search_text)


''''获取文件地址'''
home = urllib.urlopen('http://www.panduoduo.net/s/name/'+search_text)


'''获取百度云地址'''
def getbaidu(adr):
  for i in adr:
    url = urllib.urlopen('http://www.panduoduo.net'+i)
    bs = BeautifulSoup(url)
    bs1 = bs.select('.dbutton2')
    href = re.compile('http\%(\%|\d|\w|\/\/|\/|\.)*')
    b = href.search(str(bs1))
    name = str(bs.select('.center')).decode('utf-8')
    text1 = re.compile('\<h1\sclass\=\"center"\>[\d|\w|\D|\W]*\</h1\>')
    text2 = text1.search(name)
    rag1 = re.compile('\>[\d|\w|\D|\W]*\<')
    if text2:
      text3 = rag1.search(text2.group())
      if text3:
        print text3.group()
    if b:
      text = urllib.unquote(str(b.group())).decode('utf-8')
      print text

'''初始化'''
def init(adr):
  soup = BeautifulSoup(home)
  soup = soup.select('.row')
  pattern = re.compile('\/r\/\d+')
  for i in soup:
    i = str(i)
    adress = pattern.search(i)
    adress = adress.group()
    adr.append(adress)


print 'running---------'    
init(adr)
getbaidu(adr)

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python 的描述符 descriptor详解
Feb 27 Python
Python 正则表达式的高级用法
Dec 04 Python
神经网络理论基础及Python实现详解
Dec 15 Python
将python文件打包成EXE应用程序的方法
May 22 Python
django 自定义filter 判断if var in list的例子
Aug 20 Python
Python序列对象与String类型内置方法详解
Oct 22 Python
Python3自动生成MySQL数据字典的markdown文本的实现
May 07 Python
Python持续监听文件变化代码实例
Jul 22 Python
使用Python下载抖音各大V视频的思路详解
Feb 06 Python
写一个Python脚本下载哔哩哔哩舞蹈区的所有视频
May 31 Python
Python中glob库实现文件名的匹配
Jun 18 Python
python 离散点图画法的实现
Apr 01 Python
Python的IDEL增加清屏功能实例
Jun 19 #Python
利用python爬取散文网的文章实例教程
Jun 18 #Python
Python3中简单的文件操作及两个简单小实例分享
Jun 18 #Python
python实现各进制转换的总结大全
Jun 18 #Python
Mac 上切换Python多版本
Jun 17 #Python
利用python实现xml与数据库读取转换的方法
Jun 17 #Python
用python写个自动SSH登录远程服务器的小工具(实例)
Jun 17 #Python
You might like
SONY SRF-40W电路分析
2021/03/02 无线电
最简单的PHP程序--记数器
2006/10/09 PHP
php缩放图片(根据宽高的等比例缩放)实例介绍
2013/06/09 PHP
ecshop适应在PHP7的修改方法解决报错的实现
2016/11/01 PHP
Yii2框架视图(View)操作及Layout的使用方法分析
2019/05/27 PHP
7款风格新颖的jQuery/CSS3菜单导航分享
2013/04/23 Javascript
js实现屏蔽默认快捷键调用自定义事件示例
2013/06/18 Javascript
jquery创建表格(自动增加表格)代码分享
2013/12/25 Javascript
JS不间断向上滚动效果代码
2013/12/25 Javascript
用unescape反编码得出汉字示例
2014/04/24 Javascript
浅析Node.js查找字符串功能
2014/09/03 Javascript
js中javascript:void(0) 真正含义
2020/11/05 Javascript
基于jquery实现省市联动效果
2015/11/23 Javascript
js 声明数组和向数组中添加对象变量的简单实例
2016/07/28 Javascript
bootstrap输入框组件使用方法详解
2017/01/19 Javascript
vue mintui-Loadmore结合实现下拉刷新和上拉加载示例
2017/10/12 Javascript
JavaScript实现简单的图片切换功能(实例代码)
2020/04/10 Javascript
Python采用socket模拟TCP通讯的实现方法
2014/11/19 Python
Python中的深拷贝和浅拷贝详解
2015/06/03 Python
python fabric实现远程部署
2017/01/05 Python
python 创建一个空dataframe 然后添加行数据的实例
2018/06/07 Python
示例详解Python3 or Python2 两者之间的差异
2018/08/23 Python
python射线法判断一个点在图形区域内外
2019/06/28 Python
Django如何简单快速实现PUT、DELETE方法
2019/07/24 Python
Python字典中的值为列表或字典的构造实例
2019/12/16 Python
Python谱减法语音降噪实例
2019/12/18 Python
详解python 破解网站反爬虫的两种简单方法
2020/02/09 Python
Python第三方库的几种安装方式(小结)
2020/04/03 Python
html5教程实现Photoshop渐变色效果
2013/12/04 HTML / CSS
理肤泉美国官网:La Roche-Posay
2018/01/17 全球购物
2014学雷锋活动心得体会
2014/03/10 职场文书
文明村镇申报材料
2014/05/06 职场文书
如何写通讯稿
2015/07/22 职场文书
2015年中学体育教师工作总结
2015/10/23 职场文书
低端且暴利的线上线下创业项目分享
2019/09/03 职场文书
零基础学java之带返回值的方法的定义和调用
2022/04/10 Java/Android