使用Python抓取模板之家的CSS模板


Posted in Python onMarch 16, 2015

Python版本是2.7.9,在win8上测试成功,就是抓取有点慢,本来想用多线程的,有事就罢了。模板之家的网站上的url参数与页数不匹配,懒得去做分析了,就自己改代码中的url吧。大神勿喷!

#!/usr/bin/env python

# -*- coding: utf-8 -*-

# by ustcwq

# 2015-03-15

 

import urllib,urllib2,os,time

from bs4 import BeautifulSoup

 

start = time.clock()

path = os.getcwd()+u'/模板之家抓取的模板/'

if not os.path.isdir(path):

    os.mkdir(path)

 

url = "http://www.cssmoban.com/cssthemes/index_80.shtml"    # 源网站中的index后面数字怎么编排的?

theme_url ='http://www.cssmoban.com/cssthemes/'

response = urllib2.urlopen(url)

soup = BeautifulSoup(response) 

result = soup.select('p[class="title"] a')

print result

 

for item in result:

    link = item['href']

    # down_name = item.text   # 文件名称

    new_url = theme_url+link.split('/')[-1]

    response = urllib2.urlopen(new_url)

    soup = BeautifulSoup(response) 

    result = soup.select('.btn a')

    down_url = result[1]['href']    # 文件链接

 

    local = path+time.strftime('%Y%m%d%H%M%S',time.localtime(time.time()))+'.zip' 

    urllib.urlretrieve(down_url, local) # 远程保存函数

 

end = time.clock()

print u'模板抓取完成!'

print u'一共用时:',end-start,u'秒'

使用Python抓取模板之家的CSS模板

使用Python抓取模板之家的CSS模板

以上所述就是本文的全部内容了,希望大家能够喜欢。

Python 相关文章推荐
python开发之for循环操作实例详解
Nov 12 Python
Python采用Django制作简易的知乎日报API
Aug 03 Python
Python+MongoDB自增键值的简单实现
Nov 04 Python
Python 爬虫图片简单实现
Jun 01 Python
Python中修改字符串的四种方法
Nov 02 Python
python抓取京东小米8手机配置信息
Nov 13 Python
使用python判断jpeg图片的完整性实例
Jun 10 Python
python从list列表中选出一个数和其对应的坐标方法
Jul 20 Python
详解Python 中sys.stdin.readline()的用法
Sep 12 Python
浅析python redis的连接及相关操作
Nov 07 Python
python与pycharm有何区别
Jul 01 Python
python 实现的IP 存活扫描脚本
Dec 10 Python
Python实现竖排打印传单手机号码易撕条
Mar 16 #Python
python通过exifread模块获得图片exif信息的方法
Mar 16 #Python
python通过pil模块将raw图片转换成png图片的方法
Mar 16 #Python
python通过pil将图片转换成黑白效果的方法
Mar 16 #Python
python实现获取客户机上指定文件并传输到服务器的方法
Mar 16 #Python
python提取内容关键词的方法
Mar 16 #Python
python生成随机mac地址的方法
Mar 16 #Python
You might like
PHP学习笔记之二 php入门知识
2011/01/12 PHP
提高php编程效率技巧
2015/08/13 PHP
PHP文件上传之多文件上传的实现思路
2016/01/27 PHP
JSON语法五大要素图文介绍
2012/12/04 Javascript
js修改input的type属性问题探讨
2013/10/12 Javascript
使用jQuery重置(reset)表单的方法
2014/05/05 Javascript
控制文字内容的显示与隐藏示例
2014/06/11 Javascript
jQuery+HTML5实现图片上传前预览效果
2015/08/20 Javascript
jQuery+Ajax+PHP+Mysql实现分页显示数据实例讲解
2015/09/27 Javascript
利用javascript实现的三种图片放大镜效果实例(附源码)
2017/01/23 Javascript
jQuery实现百度登录框的动态切换效果
2017/04/21 jQuery
vue中手机号,邮箱正则验证以及60s发送验证码的实例
2018/03/16 Javascript
vue3.0 CLI - 2.6 - 组件的复用入门教程
2018/09/14 Javascript
jQuery实现的自定义轮播图功能详解
2018/12/28 jQuery
vue项目打包后上传至GitHub并实现github-pages的预览
2019/05/06 Javascript
vue的注意规范之v-if 与 v-for 一起使用教程
2019/08/04 Javascript
Vue组件基础用法详解
2020/02/05 Javascript
jQuery 选择器用法实例分析【prev + next】
2020/05/22 jQuery
[01:02:06]LGD vs Mineski Supermajor 胜者组 BO3 第二场 6.5
2018/06/06 DOTA
[49:07]VGJ.T vs Optic Supermajor小组赛D组 BO3 第二场 6.3
2018/06/04 DOTA
python使用正则搜索字符串或文件中的浮点数代码实例
2014/07/11 Python
详解python进行mp3格式判断
2016/12/23 Python
Python正则抓取网易新闻的方法示例
2017/04/21 Python
windows下python之mysqldb模块安装方法
2017/09/07 Python
Python优先队列实现方法示例
2017/09/21 Python
Python PIL读取的图像发生自动旋转的实现方法
2019/07/05 Python
python基于json文件实现的gearman任务自动重启代码实例
2019/08/13 Python
Python判断三段线能否构成三角形的代码
2020/04/12 Python
使用Canvas操作像素的方法
2018/06/14 HTML / CSS
美国诺德斯特龙百货官网:Nordstrom
2016/08/23 全球购物
美国摄影爱好者购物网站:Focus Camera
2016/10/21 全球购物
Sandro法国官网:法国成衣品牌
2019/08/28 全球购物
企业职业病防治方案
2014/05/29 职场文书
2015年度学校卫生工作总结
2015/05/12 职场文书
用 Python 定义 Schema 并生成 Parquet 文件详情
2021/09/25 Python
Python如何让字典保持有序排列
2022/04/29 Python