使用Python抓取模板之家的CSS模板


Posted in Python onMarch 16, 2015

Python版本是2.7.9,在win8上测试成功,就是抓取有点慢,本来想用多线程的,有事就罢了。模板之家的网站上的url参数与页数不匹配,懒得去做分析了,就自己改代码中的url吧。大神勿喷!

#!/usr/bin/env python

# -*- coding: utf-8 -*-

# by ustcwq

# 2015-03-15

 

import urllib,urllib2,os,time

from bs4 import BeautifulSoup

 

start = time.clock()

path = os.getcwd()+u'/模板之家抓取的模板/'

if not os.path.isdir(path):

    os.mkdir(path)

 

url = "http://www.cssmoban.com/cssthemes/index_80.shtml"    # 源网站中的index后面数字怎么编排的?

theme_url ='http://www.cssmoban.com/cssthemes/'

response = urllib2.urlopen(url)

soup = BeautifulSoup(response) 

result = soup.select('p[class="title"] a')

print result

 

for item in result:

    link = item['href']

    # down_name = item.text   # 文件名称

    new_url = theme_url+link.split('/')[-1]

    response = urllib2.urlopen(new_url)

    soup = BeautifulSoup(response) 

    result = soup.select('.btn a')

    down_url = result[1]['href']    # 文件链接

 

    local = path+time.strftime('%Y%m%d%H%M%S',time.localtime(time.time()))+'.zip' 

    urllib.urlretrieve(down_url, local) # 远程保存函数

 

end = time.clock()

print u'模板抓取完成!'

print u'一共用时:',end-start,u'秒'

使用Python抓取模板之家的CSS模板

使用Python抓取模板之家的CSS模板

以上所述就是本文的全部内容了,希望大家能够喜欢。

Python 相关文章推荐
python 不关闭控制台的实现方法
Oct 23 Python
详解Python中的join()函数的用法
Apr 07 Python
在Python中使用pngquant压缩png图片的教程
Apr 09 Python
PyQt4编程之让状态栏显示信息的方法
Jun 18 Python
Python3从零开始搭建一个语音对话机器人的实现
Aug 23 Python
Python Tkinter Entry和Text的添加与使用详解
Mar 04 Python
python实现飞船大战
Apr 24 Python
python如何导入依赖包
Jul 13 Python
OpenCV Python实现图像指定区域裁剪
Mar 12 Python
python爬虫利器之requests库的用法(超全面的爬取网页案例)
Dec 17 Python
Python爬取某平台短视频的方法
Feb 08 Python
用Python提取PDF表格的方法
Apr 11 Python
Python实现竖排打印传单手机号码易撕条
Mar 16 #Python
python通过exifread模块获得图片exif信息的方法
Mar 16 #Python
python通过pil模块将raw图片转换成png图片的方法
Mar 16 #Python
python通过pil将图片转换成黑白效果的方法
Mar 16 #Python
python实现获取客户机上指定文件并传输到服务器的方法
Mar 16 #Python
python提取内容关键词的方法
Mar 16 #Python
python生成随机mac地址的方法
Mar 16 #Python
You might like
我的论坛源代码(五)
2006/10/09 PHP
基于mysql的论坛(6)
2006/10/09 PHP
PHP中的日期加减方法示例
2014/08/21 PHP
php文件操作之小型留言本实例
2015/06/20 PHP
PHP安装threads多线程扩展基础教程
2015/11/17 PHP
Docker搭建自己的PHP开发环境
2018/02/24 PHP
php提高脚本性能的4个技巧
2020/08/18 PHP
一些javascript一些题目的解析
2010/12/25 Javascript
jQuery bxCarousel实现图片滚动切换效果示例代码
2013/05/15 Javascript
JS Date函数整理方便使用
2013/10/23 Javascript
解析prototype,JQuery中跳出each循环的方法
2013/12/12 Javascript
导入extjs、jquery 文件时$使用冲突问题解决方法
2014/01/14 Javascript
js中将String转换为number以便比较
2014/07/08 Javascript
jquery捕捉回车键及获取checkbox值与异步请求的方法
2015/12/24 Javascript
微信小程序 wx.uploadFile在安卓手机上面the same task is working问题解决
2016/12/14 Javascript
微信小程序 使用腾讯地图SDK详解及实现步骤
2017/02/28 Javascript
Bootstrap 网格系统布局详解
2017/03/19 Javascript
JS实现线性表的链式表示方法示例【经典数据结构】
2017/04/11 Javascript
基于vue.js实现的分页
2018/03/13 Javascript
利用vscode调试编译后的js代码详解
2018/05/14 Javascript
javascript设计模式 ? 单例模式原理与应用实例分析
2020/04/09 Javascript
Django中使用locals()函数的技巧
2015/07/16 Python
python监控linux内存并写入mongodb(推荐)
2017/09/11 Python
pandas 对series和dataframe进行排序的实例
2018/06/09 Python
详解python爬虫系列之初识爬虫
2019/04/06 Python
分享CSS3中必须要知道的10个顶级命令
2012/04/26 HTML / CSS
英国领先的男装设计师服装购物网站:Mainline Menswear
2018/02/04 全球购物
美国一家运动专业鞋类零售商:Warehouse Shoe Sale(WSS)
2018/03/28 全球购物
GetYourGuide台湾:预订旅游活动、景点和旅游项目
2019/06/10 全球购物
可口可乐唇膏:Lip Smackers
2019/08/27 全球购物
Footshop法国:购买运动鞋
2020/01/19 全球购物
德国最大的婴儿用品网上商店:Kidsroom.de(支持中文)
2020/09/02 全球购物
法律工作求职自荐信
2013/10/31 职场文书
团队精神演讲稿
2013/12/31 职场文书
大型活动组织方案
2014/05/10 职场文书
聊聊SpringBoot自动装配的魔力
2021/11/17 Java/Android