使用Python抓取模板之家的CSS模板


Posted in Python onMarch 16, 2015

Python版本是2.7.9,在win8上测试成功,就是抓取有点慢,本来想用多线程的,有事就罢了。模板之家的网站上的url参数与页数不匹配,懒得去做分析了,就自己改代码中的url吧。大神勿喷!

#!/usr/bin/env python

# -*- coding: utf-8 -*-

# by ustcwq

# 2015-03-15

 

import urllib,urllib2,os,time

from bs4 import BeautifulSoup

 

start = time.clock()

path = os.getcwd()+u'/模板之家抓取的模板/'

if not os.path.isdir(path):

    os.mkdir(path)

 

url = "http://www.cssmoban.com/cssthemes/index_80.shtml"    # 源网站中的index后面数字怎么编排的?

theme_url ='http://www.cssmoban.com/cssthemes/'

response = urllib2.urlopen(url)

soup = BeautifulSoup(response) 

result = soup.select('p[class="title"] a')

print result

 

for item in result:

    link = item['href']

    # down_name = item.text   # 文件名称

    new_url = theme_url+link.split('/')[-1]

    response = urllib2.urlopen(new_url)

    soup = BeautifulSoup(response) 

    result = soup.select('.btn a')

    down_url = result[1]['href']    # 文件链接

 

    local = path+time.strftime('%Y%m%d%H%M%S',time.localtime(time.time()))+'.zip' 

    urllib.urlretrieve(down_url, local) # 远程保存函数

 

end = time.clock()

print u'模板抓取完成!'

print u'一共用时:',end-start,u'秒'

使用Python抓取模板之家的CSS模板

使用Python抓取模板之家的CSS模板

以上所述就是本文的全部内容了,希望大家能够喜欢。

Python 相关文章推荐
Python with用法实例
Apr 14 Python
详解Python中dict与set的使用
Aug 10 Python
Python中Django发送带图片和附件的邮件
Mar 31 Python
Python实现统计给定列表中指定数字出现次数的方法
Apr 11 Python
Pandas Shift函数的基础入门学习笔记
Nov 16 Python
pandas求两个表格不相交的集合方法
Dec 08 Python
使用python接入微信聊天机器人
Mar 31 Python
Python对列表的操作知识点详解
Aug 20 Python
Python 中的 import 机制之实现远程导入模块
Oct 29 Python
python几种常用功能实现代码实例
Dec 25 Python
Python图像处理库PIL的ImageGrab模块介绍详解
Feb 26 Python
利用Pycharm + Django搭建一个简单Python Web项目的步骤
Oct 22 Python
Python实现竖排打印传单手机号码易撕条
Mar 16 #Python
python通过exifread模块获得图片exif信息的方法
Mar 16 #Python
python通过pil模块将raw图片转换成png图片的方法
Mar 16 #Python
python通过pil将图片转换成黑白效果的方法
Mar 16 #Python
python实现获取客户机上指定文件并传输到服务器的方法
Mar 16 #Python
python提取内容关键词的方法
Mar 16 #Python
python生成随机mac地址的方法
Mar 16 #Python
You might like
php模拟js函数unescape的函数代码
2012/10/20 PHP
PHP array_multisort() 函数的深入解析
2013/06/20 PHP
如何使用PHP获取指定日期所在月的开始日期与结束日期
2013/08/01 PHP
php中simplexml_load_string使用实例分享
2014/02/13 PHP
PHP限制HTML内容中图片必须是本站的方法
2015/06/16 PHP
YII Framework框架教程之安全方案详解
2016/03/14 PHP
php单例模式的简单实现方法
2016/06/10 PHP
PHP array_key_exists检查键名或索引是否存在于数组中的实现方法
2016/06/13 PHP
PHP使用preg_split和explode分割textarea存放内容的方法分析
2017/07/03 PHP
php图片合成方法(多张图片合成一张)
2017/11/25 PHP
jQuery 表单验证扩展(四)
2010/10/20 Javascript
JavaScript中日常收集常见的10种错误(推荐)
2017/01/08 Javascript
浅谈Javascript事件对象
2017/02/05 Javascript
jQuery使用ajax_动力节点Java学院整理
2017/07/05 jQuery
vue自定义filters过滤器
2018/04/26 Javascript
小程序实现多选框功能
2018/10/30 Javascript
微信小程序蓝牙连接小票打印机实例代码详解
2019/06/03 Javascript
Python实现获取本地及远程图片大小的方法示例
2018/07/21 Python
pycharm 在windows上编辑代码用linux执行配置的方法
2018/10/27 Python
python下载微信公众号相关文章
2019/02/26 Python
Python3实现二叉树的最大深度
2019/09/30 Python
Python socket聊天脚本代码实例
2020/01/02 Python
python实现简单井字棋小游戏
2020/03/05 Python
Selenium使用Chrome模拟手机浏览器方法解析
2020/04/10 Python
python实现文字版扫雷
2020/04/24 Python
Python用来做Web开发的优势有哪些
2020/08/05 Python
HTML5 本地存储 LocalStorage详解
2016/06/24 HTML / CSS
Harman Audio官方商店:购买JBL、Harman Kardon、Infinity和AKG
2019/12/05 全球购物
试述DBMS的主要功能
2016/11/13 面试题
计算机应用专业学生的自我评价分享
2013/11/03 职场文书
化学实验员岗位职责
2013/12/28 职场文书
幼儿园老师寄语
2014/04/03 职场文书
英语专业求职信
2014/07/08 职场文书
优秀班主任主要事迹材料
2014/12/16 职场文书
大学生思想道德自我评价
2015/03/09 职场文书
校园广播稿范文
2015/08/19 职场文书