使用Python抓取模板之家的CSS模板


Posted in Python onMarch 16, 2015

Python版本是2.7.9,在win8上测试成功,就是抓取有点慢,本来想用多线程的,有事就罢了。模板之家的网站上的url参数与页数不匹配,懒得去做分析了,就自己改代码中的url吧。大神勿喷!

#!/usr/bin/env python

# -*- coding: utf-8 -*-

# by ustcwq

# 2015-03-15

 

import urllib,urllib2,os,time

from bs4 import BeautifulSoup

 

start = time.clock()

path = os.getcwd()+u'/模板之家抓取的模板/'

if not os.path.isdir(path):

    os.mkdir(path)

 

url = "http://www.cssmoban.com/cssthemes/index_80.shtml"    # 源网站中的index后面数字怎么编排的?

theme_url ='http://www.cssmoban.com/cssthemes/'

response = urllib2.urlopen(url)

soup = BeautifulSoup(response) 

result = soup.select('p[class="title"] a')

print result

 

for item in result:

    link = item['href']

    # down_name = item.text   # 文件名称

    new_url = theme_url+link.split('/')[-1]

    response = urllib2.urlopen(new_url)

    soup = BeautifulSoup(response) 

    result = soup.select('.btn a')

    down_url = result[1]['href']    # 文件链接

 

    local = path+time.strftime('%Y%m%d%H%M%S',time.localtime(time.time()))+'.zip' 

    urllib.urlretrieve(down_url, local) # 远程保存函数

 

end = time.clock()

print u'模板抓取完成!'

print u'一共用时:',end-start,u'秒'

使用Python抓取模板之家的CSS模板

使用Python抓取模板之家的CSS模板

以上所述就是本文的全部内容了,希望大家能够喜欢。

Python 相关文章推荐
python实现根据用户输入从电影网站获取影片信息的方法
Apr 07 Python
用python记录运行pid,并在需要时kill掉它们的实例
Jan 16 Python
Python 多进程和数据传递的理解
Oct 09 Python
python实现验证码识别功能
Jun 07 Python
详解TensorFlow查看ckpt中变量的几种方法
Jun 19 Python
Python提取支付宝和微信支付二维码的示例代码
Feb 15 Python
Python3内置模块pprint让打印比print更美观详解
Jun 02 Python
python如何实现视频转代码视频
Jun 17 Python
python 获取等间隔的数组实例
Jul 04 Python
手把手教你pycharm专业版安装破解教程(linux版)
Sep 26 Python
不到20行实现Python代码即可制作精美证件照
Apr 24 Python
Python sublime安装及配置过程详解
Jun 29 Python
Python实现竖排打印传单手机号码易撕条
Mar 16 #Python
python通过exifread模块获得图片exif信息的方法
Mar 16 #Python
python通过pil模块将raw图片转换成png图片的方法
Mar 16 #Python
python通过pil将图片转换成黑白效果的方法
Mar 16 #Python
python实现获取客户机上指定文件并传输到服务器的方法
Mar 16 #Python
python提取内容关键词的方法
Mar 16 #Python
python生成随机mac地址的方法
Mar 16 #Python
You might like
咖啡语言
2021/03/03 咖啡文化
php 生成饼图 三维饼图
2009/09/28 PHP
php 操作符与控制结构
2012/03/07 PHP
php5.2以下版本无json_decode函数的解决方法
2014/05/25 PHP
PHP直接修改表内容DataGrid功能实现代码
2015/09/24 PHP
两款万能的php分页类
2015/11/12 PHP
PHP下 Mongodb 连接远程数据库的实例代码
2017/08/30 PHP
js添加table的行和列 具体实现方法
2013/07/22 Javascript
js获取html页面节点方法(递归方式)
2013/12/13 Javascript
Javascript中this的用法详解
2014/09/22 Javascript
JS自动倒计时30秒后按钮才可用(两种场景)
2015/08/31 Javascript
jQuery中使用animate自定义动画的方法
2016/05/29 Javascript
浅谈jquery上下滑动的注意事项
2016/10/13 Javascript
angularJS实现不同视图同步刷新详解
2018/10/09 Javascript
超轻量级的js时间库miment使用解析
2019/08/02 Javascript
Vue实现图片轮播组件思路及实例解析
2020/05/11 Javascript
vue 动态生成拓扑图的示例
2021/01/03 Vue.js
[00:32]DOTA2上海特级锦标赛 Ehome战队宣传片
2016/03/03 DOTA
深入理解Python中各种方法的运作原理
2015/06/15 Python
Python六大开源框架对比
2015/10/19 Python
解读! Python在人工智能中的作用
2017/11/14 Python
浅谈Python2、Python3相对路径、绝对路径导入方法
2018/06/22 Python
python按行读取文件并找出其中指定字符串
2019/08/08 Python
Pytorch 实现自定义参数层的例子
2019/08/17 Python
Python爬虫 urllib2的使用方法详解
2019/09/23 Python
Python有参函数使用代码实例
2020/01/06 Python
CSS3 制作旋转的大风车(充满童年回忆)
2013/01/30 HTML / CSS
澳大利亚最大的百货公司:Myer
2018/12/21 全球购物
办公室内勤岗位职责范本
2013/12/09 职场文书
教师绩效工资方案
2014/02/01 职场文书
班级入场式解说词
2014/02/01 职场文书
网上快餐厅创业计划书
2014/02/01 职场文书
2014年四风问题自我剖析材料
2014/09/15 职场文书
乡镇党的群众路线教育实践活动制度建设计划
2014/11/03 职场文书
期末考试复习计划
2015/01/19 职场文书
学生会生活部工作总结2015
2015/03/31 职场文书