编写Python脚本批量下载DesktopNexus壁纸的教程


Posted in Python onMay 06, 2015

DesktopNexus 是我最喜爱的一个壁纸下载网站,上面有许多高质量的壁纸,几乎每天必上, 每月也必会坚持分享我这个月来收集的壁纸

但是 DesktopNexus 壁纸的下载很麻烦,而且因为壁纸会通过浏览器检测你当前分辨率来展示 合适你当前分辨率的壁纸,再加上是国外的网站,速度上很不乐观。

于是我写了个脚本,检测输入的页面中壁纸页面的链接,然后批量下载到指定文件夹中。

脚本使用 python 写的,所以需要机器上安装有 python 。
用法:

$ python desktop_nexus.py -p http://www.desktopnexus.com/tag/cat/ -s 1280x800 -o wallpapers

    -p 包含 DesktopNexus 壁纸链接的页面,比如我的壁纸分享
    -s 壁纸尺寸,可选,缺省为 1440x900
    -o 壁纸输出的文件夹,可选,缺省为当前目录下的 wallpapers, 如果不存在会自动创建

代码:

#-*- coding: utf-8 -*-
from argparse import ArgumentParser

import os, re, sys
import urllib2, cookielib, urlparse

RE_WALLPAPER = r'http\:\/\/[^\/\.]+\.desktopnexus\.com\/wallpaper\/\d+\/'
CHUNK_SIZE = 1024 * 3

class DesktopNexus:
  def __init__(self, page=None, size=None, output_dir=None):
    self.page = page
    self.size = size
    self.output_dir = output_dir

  def start(self):
    print 'Making output directory:', self.output_dir
    if not os.path.exists(self.output_dir):
      os.makedirs(self.output_dir)

    # Setup cookie
    cookie = cookielib.CookieJar()
    processer = urllib2.HTTPCookieProcessor(cookie)
    opener = urllib2.build_opener(processer)
    urllib2.install_opener(opener)

    self._read_page()

  def _get_pic_info(self, url):
    pic_id = url.split('/')[-2]
    html = urllib2.urlopen(url).read()
    pattern = r'<a href=\"\/get\/%s\/\?t=(?P<token>.*?)\"' % pic_id
    match = re.search(pattern, html, flags=re.I|re.M|re.S)
    if match:
      return {'id': pic_id,
          'token': match.group('token'),
          'size': self.size}
    else:
      raise Exception('Cound not find wallpaper')

  def _get_pic_file(self, pic_info):
    redirect_url = 'http://www.desktopnexus.com/dl/inline/%(id)s/%(size)s/%(token)s' % pic_info

    request = urllib2.urlopen(redirect_url)
    return request.geturl()

  def _download_pic(self, url):
    pic_info = self._get_pic_info(url)
    pic_file = self._get_pic_file(pic_info)
    filename = os.path.split(urlparse.urlparse(pic_file).path)[-1]
    filename = os.path.join(self.output_dir, filename)
    with open(filename, 'wb') as output:
      resp = urllib2.urlopen(pic_file)
      total_size = int(resp.info().get('Content-Length'))
      saved_size = 0.0
      while saved_size != total_size:
        chunk = resp.read(CHUNK_SIZE)
        saved_size += len(chunk)
        output.write(chunk)
        self._print_progress('Saving file: %s' % filename, \
            saved_size / total_size * 100)

  def _print_progress(self, msg, progress):
    sys.stdout.write('%-71s%3d%%\r' \
        % (len(msg) <= 70 and msg or msg[:67] + '...', progress))
    sys.stdout.flush()
    if progress >= 100:
      sys.stdout.write('\n')

  def _read_page(self):
    try:
      print 'Fetching content:', self.page
      html = urllib2.urlopen(self.page).read()
      links = set(re.findall(RE_WALLPAPER, html, re.M|re.I))
      count = len(links)

      print 'Downloading wallpapers:'
      for i, link in enumerate(links):
        print '[%d/%d]: %s' % (i + 1, count, link)
        try:
          self._download_pic(link)
        except Exception as e:
          print 'Error downloading wallpaper.', e.message
    except Exception as e:
      print 'Error fetching content.', e

if __name__ == '__main__':
  # Setup argparser
  parser = ArgumentParser('python desktop_nexus.py')
  parser.add_argument('-p', '--page', dest='page', required=True, \
      help='specific a page that includes wallpaper list')
  parser.add_argument('-s', '--size', dest='size', default='1440x900', \
      help='specific the wallpaper size, default to 1440x900')
  parser.add_argument('-o', '--output', dest='output_dir', default='wallpapers', \
      help='specific the output directory, default to "wallpapers"')
  args = parser.parse_args()
  dn = DesktopNexus(**args.__dict__)
  dn.start()

Python 相关文章推荐
Python通过websocket与js客户端通信示例分析
Jun 25 Python
python创建和删除目录的方法
Apr 29 Python
详解python脚本自动生成需要文件实例代码
Feb 04 Python
python中文分词教程之前向最大正向匹配算法详解
Nov 02 Python
Python嵌套列表转一维的方法(压平嵌套列表)
Jul 03 Python
Python爬虫常用小技巧之设置代理IP
Sep 13 Python
解决pycharm中opencv-python导入cv2后无法自动补全的问题(不用作任何文件上的修改)
Mar 05 Python
Python实现Wordcloud生成词云图的示例
Mar 30 Python
python matplotlib:plt.scatter() 大小和颜色参数详解
Apr 14 Python
Python参数传递对象的引用原理解析
May 22 Python
python如何使用代码运行助手
Jul 03 Python
tensorflow学习笔记之tfrecord文件的生成与读取
Mar 31 Python
在Windows服务器下用Apache和mod_wsgi配置Python应用的教程
May 06 #Python
利用Python脚本在Nginx和uwsgi上部署MoinMoin的教程
May 05 #Python
Python实现的HTTP并发测试完整示例
Apr 23 #Python
安装dbus-python的简要教程
May 05 #Python
使用SAE部署Python运行环境的教程
May 05 #Python
在Python中使用PIL模块对图片进行高斯模糊处理的教程
May 05 #Python
在Python中使用mechanize模块模拟浏览器功能
May 05 #Python
You might like
php disk_free_space 返回目录可用空间
2010/05/10 PHP
优化PHP代码技巧的小结
2013/06/02 PHP
PHP使用星号隐藏用户名,手机和邮箱的实现方法
2016/09/22 PHP
JS 常用校验函数
2009/03/26 Javascript
javascript 异步页面查询实现代码(asp.net)
2010/05/26 Javascript
JavaScript的9种继承实现方式归纳
2015/05/18 Javascript
jquery实现TAB选项卡鼠标经过带延迟效果的方法
2015/07/27 Javascript
JS实现简单的二维矩阵乘积运算
2016/01/26 Javascript
超全面的vue.js使用总结
2017/02/12 Javascript
微信小程序开发之改变data中数组或对象的某一属性值
2018/07/05 Javascript
详解Koa中更方便简单发送响应的方式
2018/07/20 Javascript
jQuery实现tab栏切换效果
2020/12/22 jQuery
基于JavaScript实现轮播图效果
2021/01/02 Javascript
Python内置函数dir详解
2015/04/14 Python
Python中的anydbm模版和shelve模版使用指南
2015/07/09 Python
深入理解Python中变量赋值的问题
2017/01/12 Python
python实现八大排序算法(2)
2017/09/14 Python
Python操作Redis之设置key的过期时间实例代码
2018/01/25 Python
使用PM2+nginx部署python项目的方法示例
2018/11/07 Python
pyqt5实现登录界面的模板
2020/05/30 Python
基于python实现蓝牙通信代码实例
2019/11/19 Python
django rest framework 自定义返回方式
2020/07/12 Python
python工具快速为音视频自动生成字幕(使用说明)
2021/01/27 Python
html5 音乐播放器 audio 标签使用概述
2013/07/15 HTML / CSS
荷兰网上鞋店:Ziengs.nl
2017/01/02 全球购物
欧洲最大的美妆零售网站:Feelunique
2017/01/14 全球购物
John Varvatos官方网站:设计师男士时装
2017/02/08 全球购物
西班牙著名的珠宝首饰品牌:P D PAOLA
2018/09/15 全球购物
汽车专业毕业生自荐信
2013/11/03 职场文书
计算机维护专业推荐信
2014/02/27 职场文书
考察现实表现材料
2014/05/19 职场文书
先进员工获奖感言
2014/08/14 职场文书
党的群众路线教育实践活动对照检查材料思想汇报(党员篇)
2014/09/25 职场文书
MySQL 隔离数据列和前缀索引的使用总结
2021/05/14 MySQL
详解CSS3.0(Cascading Style Sheet) 层叠级联样式表
2021/07/16 HTML / CSS
MySql分区类型及创建分区的方法
2022/04/13 MySQL