编程 Python

使用Python抓取模板之家的CSS模板

Posted in Python onMarch 16, 2015

Python版本是2.7.9，在win8上测试成功，就是抓取有点慢，本来想用多线程的，有事就罢了。模板之家的网站上的url参数与页数不匹配，懒得去做分析了，就自己改代码中的url吧。大神勿喷！

#!/usr/bin/env python

# -*- coding: utf-8 -*-

# by ustcwq

# 2015-03-15

 

import urllib,urllib2,os,time

from bs4 import BeautifulSoup

 

start = time.clock()

path = os.getcwd()+u'/模板之家抓取的模板/'

if not os.path.isdir(path):

    os.mkdir(path)

 

url = "http://www.cssmoban.com/cssthemes/index_80.shtml"    # 源网站中的index后面数字怎么编排的？

theme_url ='http://www.cssmoban.com/cssthemes/'

response = urllib2.urlopen(url)

soup = BeautifulSoup(response) 

result = soup.select('p[class="title"] a')

print result

 

for item in result:

    link = item['href']

    # down_name = item.text   # 文件名称

    new_url = theme_url+link.split('/')[-1]

    response = urllib2.urlopen(new_url)

    soup = BeautifulSoup(response) 

    result = soup.select('.btn a')

    down_url = result[1]['href']    # 文件链接

 

    local = path+time.strftime('%Y%m%d%H%M%S',time.localtime(time.time()))+'.zip' 

    urllib.urlretrieve(down_url, local) # 远程保存函数

 

end = time.clock()

print u'模板抓取完成！'

print u'一共用时：',end-start,u'秒'

以上所述就是本文的全部内容了，希望大家能够喜欢。

使用Python抓取模板之家的CSS模板

- Author -

hebedich

声明：登载此文出于传递更多信息之目的，并不意味着赞同其观点或证实其描述。

Python 相关文章推荐

Python使用Flask框架获取当前查询参数的方法

Mar 21 Python

Python按行读取文件的实现方法【小文件和大文件读取】

Sep 19 Python

用python记录运行pid,并在需要时kill掉它们的实例

Jan 16 Python

python 统计代码行数简单实例

May 04 Python

Python中扩展包的安装方法详解

Jun 14 Python

Python使用filetype精确判断文件类型

Jul 02 Python

Python实现读取邮箱中的邮件功能示例【含文本及附件】

Aug 05 Python

将python代码和注释分离的方法

Apr 21 Python

Python使用pickle模块报错EOFError Ran out of input的解决方法

Aug 16 Python

python调用c++传递数组的实例

Feb 13 Python

Python3基础教程之递归函数简单示例

Jun 07 Python

Python yield生成器和return对比代码实例

Apr 20 Python

Python实现竖排打印传单手机号码易撕条

Mar 16 #Python

python通过exifread模块获得图片exif信息的方法

Mar 16 #Python

python通过pil模块将raw图片转换成png图片的方法

Mar 16 #Python

python通过pil将图片转换成黑白效果的方法

Mar 16 #Python

python实现获取客户机上指定文件并传输到服务器的方法

Mar 16 #Python

python提取内容关键词的方法

Mar 16 #Python

python生成随机mac地址的方法

Mar 16 #Python

You might like

PHP 图片上传代码

2011/09/13 PHP

PHP实现的登录页面信息提示功能示例

2017/07/24 PHP

Thinkphp5.0框架视图view的循环标签用法示例

2019/10/12 PHP

js之WEB开发调试利器:Firebug 下载

2007/01/13 Javascript

用prototype实现的简单小巧的多级联动菜单

2007/03/24 Javascript

用javascript实现的激活输入框后隐藏初始内容

2007/06/29 Javascript

Javascript调用C#代码

2011/01/17 Javascript

JavaScript 模拟类机制及私有变量的方法及思路

2013/07/10 Javascript

javascript模拟实现C# String.format函数功能代码

2013/11/25 Javascript

js菜单点击显示或隐藏效果的简单实例

2014/01/13 Javascript

javascript 3d 逐侦产品展示(核心精简)

2014/03/26 Javascript

如何防止回车(enter)键提交表单

2014/05/11 Javascript

Javascript基础教程之关键字和保留字汇总

2015/01/18 Javascript

jQuery.prop() 使用详解

2015/07/19 Javascript

jQuery插件FusionCharts实现的2D饼状图效果【附demo源码下载】

2017/03/03 Javascript

详解使用Typescript开发node.js项目（简单的环境配置）

2017/10/09 Javascript

jQuery读取本地的json文件(实例讲解)

2017/10/31 jQuery

在 vue-cli v3.0 中使用 SCSS/SASS的方法

2018/06/14 Javascript

Vue子组件向父组件通信与父组件调用子组件中的方法

2018/06/22 Javascript

vue、react等单页面项目部署到服务器的方法及vue和react的区别

2018/09/29 Javascript

vue spa应用中的路由缓存问题与解决方案

2019/05/31 Javascript

jquery实现图片放大镜效果

2020/12/23 jQuery

压缩包密码破解示例分享(类似典破解)

2014/01/17 Python

Python使用PIL模块生成随机验证码

2017/11/21 Python

Python将多个excel表格合并为一个表格

2021/02/22 Python

Python堆排序原理与实现方法详解

2018/05/11 Python

详解python列表（list）的使用技巧及高级操作

2019/08/15 Python

PYTHON绘制雷达图代码实例

2019/10/15 Python

Python 操作 PostgreSQL 数据库示例【连接、增删改查等】

2020/04/21 Python

SQL注入攻击的种类有哪些

2013/12/30 面试题

中文专业毕业生自荐信

2013/10/28 职场文书

领导检查欢迎词

2014/01/14 职场文书

遵纪守法演讲稿

2014/05/23 职场文书

环保公益策划方案

2014/08/15 职场文书

教育局党的群众路线教育实践活动整改方案

2014/09/20 职场文书

选购到合适的激光打印机

2022/04/21 数码科技