使用Python抓取模板之家的CSS模板


Posted in Python onMarch 16, 2015

Python版本是2.7.9,在win8上测试成功,就是抓取有点慢,本来想用多线程的,有事就罢了。模板之家的网站上的url参数与页数不匹配,懒得去做分析了,就自己改代码中的url吧。大神勿喷!

#!/usr/bin/env python

# -*- coding: utf-8 -*-

# by ustcwq

# 2015-03-15

 

import urllib,urllib2,os,time

from bs4 import BeautifulSoup

 

start = time.clock()

path = os.getcwd()+u'/模板之家抓取的模板/'

if not os.path.isdir(path):

    os.mkdir(path)

 

url = "http://www.cssmoban.com/cssthemes/index_80.shtml"    # 源网站中的index后面数字怎么编排的?

theme_url ='http://www.cssmoban.com/cssthemes/'

response = urllib2.urlopen(url)

soup = BeautifulSoup(response) 

result = soup.select('p[class="title"] a')

print result

 

for item in result:

    link = item['href']

    # down_name = item.text   # 文件名称

    new_url = theme_url+link.split('/')[-1]

    response = urllib2.urlopen(new_url)

    soup = BeautifulSoup(response) 

    result = soup.select('.btn a')

    down_url = result[1]['href']    # 文件链接

 

    local = path+time.strftime('%Y%m%d%H%M%S',time.localtime(time.time()))+'.zip' 

    urllib.urlretrieve(down_url, local) # 远程保存函数

 

end = time.clock()

print u'模板抓取完成!'

print u'一共用时:',end-start,u'秒'

使用Python抓取模板之家的CSS模板

使用Python抓取模板之家的CSS模板

以上所述就是本文的全部内容了,希望大家能够喜欢。

Python 相关文章推荐
Python基类函数的重载与调用实例分析
Jan 12 Python
Python中使用Boolean操作符做真值测试实例
Jan 30 Python
Python使用matplotlib绘制正弦和余弦曲线的方法示例
Jan 06 Python
python 读取txt中每行数据,并且保存到excel中的实例
Apr 29 Python
Python BS4库的安装与使用详解
Aug 08 Python
使用python批量读取word文档并整理关键信息到excel表格的实例
Nov 07 Python
Python实现Selenium自动化Page模式
Jul 14 Python
python正则表达式匹配不包含某几个字符的字符串方法
Jul 23 Python
python定位xpath 节点位置的方法
Aug 27 Python
flask框架配置mysql数据库操作详解
Nov 29 Python
PyCharm Community安装与配置的详细教程
Nov 24 Python
python3 hdf5文件 遍历代码
May 19 Python
Python实现竖排打印传单手机号码易撕条
Mar 16 #Python
python通过exifread模块获得图片exif信息的方法
Mar 16 #Python
python通过pil模块将raw图片转换成png图片的方法
Mar 16 #Python
python通过pil将图片转换成黑白效果的方法
Mar 16 #Python
python实现获取客户机上指定文件并传输到服务器的方法
Mar 16 #Python
python提取内容关键词的方法
Mar 16 #Python
python生成随机mac地址的方法
Mar 16 #Python
You might like
经典的PHPer为什么被认为是草根?
2007/04/02 PHP
php 网页游戏开发入门教程一(webgame+design)
2009/10/26 PHP
php switch语句多个值匹配同一代码块应用示例
2014/07/29 PHP
PHP获取数组的键与值方法小结
2015/06/13 PHP
用js实现计算代码行数的简单方法附代码
2007/08/13 Javascript
JavaScript 提升运行速度之循环篇 译文
2009/08/15 Javascript
jquery的选择器的使用技巧之如何选择input框
2013/09/22 Javascript
js控制表单不能输入空格的小例子
2013/11/20 Javascript
js获取下拉列表框中的value和text的值示例代码
2014/01/11 Javascript
jQuery简易图片放大特效示例代码
2014/06/09 Javascript
JavaScript中匿名函数用法实例
2015/03/23 Javascript
JavaScript实现点击按钮字体放大、缩小
2016/02/29 Javascript
全面解析Bootstrap中transition、affix的使用方法
2016/05/30 Javascript
Jquery 自定义事件实现发布/订阅的简单实例
2016/06/12 Javascript
移动端利用H5实现压缩图片上传功能
2017/03/29 Javascript
详解React-Native全球化多语言切换工具库react-native-i18n
2017/11/03 Javascript
JQuery实现table中tr上移下移的示例(超简单)
2018/01/08 jQuery
关于vue中的ajax请求和axios包问题
2018/04/19 Javascript
基于Vue 撸一个指令实现拖拽功能
2019/10/09 Javascript
js回调函数原理与用法案例分析
2020/03/04 Javascript
小程序中的箭头函数的具体使用
2020/06/19 Javascript
详解React的回调渲染模式
2020/09/10 Javascript
浅谈Python生成器generator之next和send的运行流程(详解)
2017/05/08 Python
python微元法计算函数曲线长度的方法
2018/11/08 Python
Python提取频域特征知识点浅析
2019/03/04 Python
python 生成任意形状的凸包图代码
2020/04/16 Python
python爬虫把url链接编码成gbk2312格式过程解析
2020/06/08 Python
pyecharts在数据可视化中的应用详解
2020/06/08 Python
基于nexus3配置Python仓库过程详解
2020/06/15 Python
HTML5 video 事件应用示例
2014/09/11 HTML / CSS
便利店投资创业计划书
2014/02/08 职场文书
答谢会策划方案
2014/05/12 职场文书
支部书记四风问题自我剖析材料
2014/09/29 职场文书
Python手拉手教你爬取贝壳房源数据的实战教程
2021/05/21 Python
《艾尔登法环》发布最新「战技」宣传片
2022/04/03 其他游戏
Win10加载疑难解答时出错发生意外错误的解决方法
2022/07/07 数码科技