使用Python抓取模板之家的CSS模板


Posted in Python onMarch 16, 2015

Python版本是2.7.9,在win8上测试成功,就是抓取有点慢,本来想用多线程的,有事就罢了。模板之家的网站上的url参数与页数不匹配,懒得去做分析了,就自己改代码中的url吧。大神勿喷!

#!/usr/bin/env python

# -*- coding: utf-8 -*-

# by ustcwq

# 2015-03-15

 

import urllib,urllib2,os,time

from bs4 import BeautifulSoup

 

start = time.clock()

path = os.getcwd()+u'/模板之家抓取的模板/'

if not os.path.isdir(path):

    os.mkdir(path)

 

url = "http://www.cssmoban.com/cssthemes/index_80.shtml"    # 源网站中的index后面数字怎么编排的?

theme_url ='http://www.cssmoban.com/cssthemes/'

response = urllib2.urlopen(url)

soup = BeautifulSoup(response) 

result = soup.select('p[class="title"] a')

print result

 

for item in result:

    link = item['href']

    # down_name = item.text   # 文件名称

    new_url = theme_url+link.split('/')[-1]

    response = urllib2.urlopen(new_url)

    soup = BeautifulSoup(response) 

    result = soup.select('.btn a')

    down_url = result[1]['href']    # 文件链接

 

    local = path+time.strftime('%Y%m%d%H%M%S',time.localtime(time.time()))+'.zip' 

    urllib.urlretrieve(down_url, local) # 远程保存函数

 

end = time.clock()

print u'模板抓取完成!'

print u'一共用时:',end-start,u'秒'

使用Python抓取模板之家的CSS模板

使用Python抓取模板之家的CSS模板

以上所述就是本文的全部内容了,希望大家能够喜欢。

Python 相关文章推荐
Python使用Flask框架获取当前查询参数的方法
Mar 21 Python
Python按行读取文件的实现方法【小文件和大文件读取】
Sep 19 Python
用python记录运行pid,并在需要时kill掉它们的实例
Jan 16 Python
python 统计代码行数简单实例
May 04 Python
Python中扩展包的安装方法详解
Jun 14 Python
Python使用filetype精确判断文件类型
Jul 02 Python
Python实现读取邮箱中的邮件功能示例【含文本及附件】
Aug 05 Python
将python代码和注释分离的方法
Apr 21 Python
Python使用pickle模块报错EOFError Ran out of input的解决方法
Aug 16 Python
python调用c++传递数组的实例
Feb 13 Python
Python3基础教程之递归函数简单示例
Jun 07 Python
Python yield生成器和return对比代码实例
Apr 20 Python
Python实现竖排打印传单手机号码易撕条
Mar 16 #Python
python通过exifread模块获得图片exif信息的方法
Mar 16 #Python
python通过pil模块将raw图片转换成png图片的方法
Mar 16 #Python
python通过pil将图片转换成黑白效果的方法
Mar 16 #Python
python实现获取客户机上指定文件并传输到服务器的方法
Mar 16 #Python
python提取内容关键词的方法
Mar 16 #Python
python生成随机mac地址的方法
Mar 16 #Python
You might like
PHP 图片上传代码
2011/09/13 PHP
PHP实现的登录页面信息提示功能示例
2017/07/24 PHP
Thinkphp5.0框架视图view的循环标签用法示例
2019/10/12 PHP
js之WEB开发调试利器:Firebug 下载
2007/01/13 Javascript
用prototype实现的简单小巧的多级联动菜单
2007/03/24 Javascript
用javascript实现的激活输入框后隐藏初始内容
2007/06/29 Javascript
Javascript调用C#代码
2011/01/17 Javascript
JavaScript 模拟类机制及私有变量的方法及思路
2013/07/10 Javascript
javascript模拟实现C# String.format函数功能代码
2013/11/25 Javascript
js菜单点击显示或隐藏效果的简单实例
2014/01/13 Javascript
javascript 3d 逐侦产品展示(核心精简)
2014/03/26 Javascript
如何防止回车(enter)键提交表单
2014/05/11 Javascript
Javascript基础教程之关键字和保留字汇总
2015/01/18 Javascript
jQuery.prop() 使用详解
2015/07/19 Javascript
jQuery插件FusionCharts实现的2D饼状图效果【附demo源码下载】
2017/03/03 Javascript
详解使用Typescript开发node.js项目(简单的环境配置)
2017/10/09 Javascript
jQuery读取本地的json文件(实例讲解)
2017/10/31 jQuery
在 vue-cli v3.0 中使用 SCSS/SASS的方法
2018/06/14 Javascript
Vue子组件向父组件通信与父组件调用子组件中的方法
2018/06/22 Javascript
vue、react等单页面项目部署到服务器的方法及vue和react的区别
2018/09/29 Javascript
vue spa应用中的路由缓存问题与解决方案
2019/05/31 Javascript
jquery实现图片放大镜效果
2020/12/23 jQuery
压缩包密码破解示例分享(类似典破解)
2014/01/17 Python
Python使用PIL模块生成随机验证码
2017/11/21 Python
Python将多个excel表格合并为一个表格
2021/02/22 Python
Python堆排序原理与实现方法详解
2018/05/11 Python
详解python列表(list)的使用技巧及高级操作
2019/08/15 Python
PYTHON绘制雷达图代码实例
2019/10/15 Python
Python 操作 PostgreSQL 数据库示例【连接、增删改查等】
2020/04/21 Python
SQL注入攻击的种类有哪些
2013/12/30 面试题
中文专业毕业生自荐信
2013/10/28 职场文书
领导检查欢迎词
2014/01/14 职场文书
遵纪守法演讲稿
2014/05/23 职场文书
环保公益策划方案
2014/08/15 职场文书
教育局党的群众路线教育实践活动整改方案
2014/09/20 职场文书
选购到合适的激光打印机
2022/04/21 数码科技