使用Python抓取模板之家的CSS模板


Posted in Python onMarch 16, 2015

Python版本是2.7.9,在win8上测试成功,就是抓取有点慢,本来想用多线程的,有事就罢了。模板之家的网站上的url参数与页数不匹配,懒得去做分析了,就自己改代码中的url吧。大神勿喷!

#!/usr/bin/env python

# -*- coding: utf-8 -*-

# by ustcwq

# 2015-03-15

 

import urllib,urllib2,os,time

from bs4 import BeautifulSoup

 

start = time.clock()

path = os.getcwd()+u'/模板之家抓取的模板/'

if not os.path.isdir(path):

    os.mkdir(path)

 

url = "http://www.cssmoban.com/cssthemes/index_80.shtml"    # 源网站中的index后面数字怎么编排的?

theme_url ='http://www.cssmoban.com/cssthemes/'

response = urllib2.urlopen(url)

soup = BeautifulSoup(response) 

result = soup.select('p[class="title"] a')

print result

 

for item in result:

    link = item['href']

    # down_name = item.text   # 文件名称

    new_url = theme_url+link.split('/')[-1]

    response = urllib2.urlopen(new_url)

    soup = BeautifulSoup(response) 

    result = soup.select('.btn a')

    down_url = result[1]['href']    # 文件链接

 

    local = path+time.strftime('%Y%m%d%H%M%S',time.localtime(time.time()))+'.zip' 

    urllib.urlretrieve(down_url, local) # 远程保存函数

 

end = time.clock()

print u'模板抓取完成!'

print u'一共用时:',end-start,u'秒'

使用Python抓取模板之家的CSS模板

使用Python抓取模板之家的CSS模板

以上所述就是本文的全部内容了,希望大家能够喜欢。

Python 相关文章推荐
Python入门教程之运算符与控制流
Aug 17 Python
python实现百万答题自动百度搜索答案
Jan 16 Python
用python标准库difflib比较两份文件的异同详解
Nov 16 Python
python调用java的jar包方法
Dec 15 Python
python selenium循环登陆网站的实现
Nov 04 Python
Python3开发实例之非关系型图数据库Neo4j安装方法及Python3连接操作Neo4j方法实例
Mar 18 Python
Python使用扩展库pywin32实现批量文档打印实例
Apr 09 Python
浅谈TensorFlow中读取图像数据的三种方式
Jun 30 Python
利用Python中的Xpath实现一个在线汇率转换器
Sep 09 Python
pycharm + django跨域无提示的解决方法
Dec 06 Python
pycharm配置python 设置pip安装源为豆瓣源
Feb 05 Python
pandas求平均数和中位数的方法实例
Aug 04 Python
Python实现竖排打印传单手机号码易撕条
Mar 16 #Python
python通过exifread模块获得图片exif信息的方法
Mar 16 #Python
python通过pil模块将raw图片转换成png图片的方法
Mar 16 #Python
python通过pil将图片转换成黑白效果的方法
Mar 16 #Python
python实现获取客户机上指定文件并传输到服务器的方法
Mar 16 #Python
python提取内容关键词的方法
Mar 16 #Python
python生成随机mac地址的方法
Mar 16 #Python
You might like
php google或baidu分页代码
2009/11/26 PHP
JavaScript去掉空格的方法集合
2010/12/28 Javascript
jquery中ajax学习笔记4
2011/10/16 Javascript
js实现幻灯片效果(基于jquery插件)
2013/11/05 Javascript
深入理解jQuery中live与bind方法的区别
2013/12/18 Javascript
js跳转页面方法总结
2014/01/29 Javascript
JavaScript的null和undefined区别示例介绍
2014/09/15 Javascript
JS数组的常见用法实例
2015/02/10 Javascript
使用AOP改善javascript代码
2015/05/01 Javascript
javascript伸缩型菜单实现代码
2015/11/16 Javascript
使用Browserify来实现CommonJS的浏览器加载方法
2017/05/14 Javascript
vue数据双向绑定的注意点
2017/06/23 Javascript
js中的 || 与 && 运算符详解
2018/05/24 Javascript
在vue中使用Autoprefixed的方法
2018/07/27 Javascript
JavaScript学习笔记之数组基本操作示例
2019/01/09 Javascript
JS对象和字符串之间互换操作实例分析
2019/02/02 Javascript
基于layui实现高级搜索(筛选)功能
2019/07/26 Javascript
javascript二维数组和对象的深拷贝与浅拷贝实例分析
2019/10/26 Javascript
vue请求服务器数据后绑定不上的解决方法
2019/10/30 Javascript
jQuery实现全选按钮
2021/01/01 jQuery
[01:33:14]LGD vs VP Supermajor 败者组决赛 BO3 第二场 6.10
2018/07/04 DOTA
[45:34]完美世界DOTA2联赛PWL S3 Rebirth vs CPG 第一场 12.18
2020/12/19 DOTA
django框架自定义用户表操作示例
2018/08/07 Python
tensorflow实现加载mnist数据集
2018/09/08 Python
python爬虫之验证码篇3-滑动验证码识别技术
2019/04/11 Python
Django用户认证系统如何实现自定义
2020/11/12 Python
Eastbay官网:美国最大的运动鞋网络零售商
2016/07/27 全球购物
德国鞋子网上商店:Omoda.de
2017/03/31 全球购物
GoPro摄像机美国官网:美国运动相机厂商
2018/07/03 全球购物
彪马日本官网:PUMA日本
2019/01/31 全球购物
大学生工作自荐书
2014/06/16 职场文书
2015年行政助理工作总结
2015/04/30 职场文书
毕业典礼主持词
2015/06/29 职场文书
2016年大学生实习单位评语
2015/12/01 职场文书
选对餐饮营销策略,营业额才会上涨
2019/08/27 职场文书
windows server2016安装oracle 11g的图文教程
2022/07/15 Servers