使用Python抓取模板之家的CSS模板


Posted in Python onMarch 16, 2015

Python版本是2.7.9,在win8上测试成功,就是抓取有点慢,本来想用多线程的,有事就罢了。模板之家的网站上的url参数与页数不匹配,懒得去做分析了,就自己改代码中的url吧。大神勿喷!

#!/usr/bin/env python

# -*- coding: utf-8 -*-

# by ustcwq

# 2015-03-15

 

import urllib,urllib2,os,time

from bs4 import BeautifulSoup

 

start = time.clock()

path = os.getcwd()+u'/模板之家抓取的模板/'

if not os.path.isdir(path):

    os.mkdir(path)

 

url = "http://www.cssmoban.com/cssthemes/index_80.shtml"    # 源网站中的index后面数字怎么编排的?

theme_url ='http://www.cssmoban.com/cssthemes/'

response = urllib2.urlopen(url)

soup = BeautifulSoup(response) 

result = soup.select('p[class="title"] a')

print result

 

for item in result:

    link = item['href']

    # down_name = item.text   # 文件名称

    new_url = theme_url+link.split('/')[-1]

    response = urllib2.urlopen(new_url)

    soup = BeautifulSoup(response) 

    result = soup.select('.btn a')

    down_url = result[1]['href']    # 文件链接

 

    local = path+time.strftime('%Y%m%d%H%M%S',time.localtime(time.time()))+'.zip' 

    urllib.urlretrieve(down_url, local) # 远程保存函数

 

end = time.clock()

print u'模板抓取完成!'

print u'一共用时:',end-start,u'秒'

使用Python抓取模板之家的CSS模板

使用Python抓取模板之家的CSS模板

以上所述就是本文的全部内容了,希望大家能够喜欢。

Python 相关文章推荐
各种Python库安装包下载地址与安装过程详细介绍(Windows版)
Nov 02 Python
Python数据分析之真实IP请求Pandas详解
Nov 18 Python
python 爬虫出现403禁止访问错误详解
Mar 11 Python
详解python OpenCV学习笔记之直方图均衡化
Feb 08 Python
Python数据可视化库seaborn的使用总结
Jan 15 Python
对python读取zip压缩文件里面的csv数据实例详解
Feb 08 Python
Python2.7版os.path.isdir中文路径返回false的解决方法
Jun 21 Python
Python设置matplotlib.plot的坐标轴刻度间隔以及刻度范围
Jun 25 Python
Python post请求实现代码实例
Feb 28 Python
keras读取训练好的模型参数并把参数赋值给其它模型详解
Jun 15 Python
基于python实现可视化生成二维码工具
Jul 08 Python
python实现股票历史数据可视化分析案例
Jun 10 Python
Python实现竖排打印传单手机号码易撕条
Mar 16 #Python
python通过exifread模块获得图片exif信息的方法
Mar 16 #Python
python通过pil模块将raw图片转换成png图片的方法
Mar 16 #Python
python通过pil将图片转换成黑白效果的方法
Mar 16 #Python
python实现获取客户机上指定文件并传输到服务器的方法
Mar 16 #Python
python提取内容关键词的方法
Mar 16 #Python
python生成随机mac地址的方法
Mar 16 #Python
You might like
windows xp下安装pear
2006/12/02 PHP
php生成二维码的几种方式整理及使用实例
2013/06/03 PHP
PHP获取当前所在目录位置的方法
2014/11/26 PHP
laravel5.2实现区分前后台用户登录的方法
2017/01/11 PHP
Laravel框架中VerifyCsrfToken报错问题的解决
2017/08/30 PHP
鼠标图片振动代码
2006/07/06 Javascript
索趣科技的答案
2007/02/07 Javascript
Use Word to Search for Files
2007/06/15 Javascript
js批量设置样式的三种方法不推荐使用with
2013/02/25 Javascript
javascript获取鼠标位置部分的实例代码(兼容IE,FF)
2013/08/05 Javascript
以jQuery中$.Deferred对象为例讲解promise对象是如何处理异步问题
2015/11/13 Javascript
jquery实现邮箱自动填充提示功能
2015/11/17 Javascript
js实现将选中内容分享到新浪或腾讯微博
2015/12/16 Javascript
基于canvas实现的绚丽圆圈效果完整实例
2016/01/26 Javascript
老生常谈Javascript中的原型和this指针
2016/10/09 Javascript
javascript 实现动态侧边栏实例详解
2016/11/11 Javascript
Vue学习之路之登录注册实例代码
2017/07/06 Javascript
Angular.js ng-file-upload结合springMVC的使用教程
2017/07/10 Javascript
js中split()方法得到的数组长度问题
2018/07/19 Javascript
详解Nuxt.js部署及踩过的坑
2018/08/07 Javascript
vue升级之路之vue-router的使用教程
2018/08/14 Javascript
微信小程序如何引用外部js,外部样式,公共页面模板
2019/07/23 Javascript
基于js实现抽红包并分配代码实例
2019/09/19 Javascript
在vue项目中利用popstate处理页面返回的操作介绍
2020/08/06 Javascript
python实现的二叉树算法和kmp算法实例
2014/04/25 Python
Python解析最简单的验证码
2016/01/07 Python
Python实现视频下载功能
2017/03/14 Python
Python排序搜索基本算法之归并排序实例分析
2017/12/08 Python
django drf框架自带的路由及最简化的视图
2019/09/10 Python
pandas将list数据拆分成行或列的实现
2020/12/13 Python
美国知名的旅游网站:OneTravel
2018/10/09 全球购物
内勤主管岗位职责
2014/04/03 职场文书
党的群众路线教育实践活动对照检查材料(教师)
2014/09/24 职场文书
2014年学生会个人工作总结
2014/11/07 职场文书
vue3使用vue-router的完整步骤记录
2021/06/20 Vue.js
JS前端使用canvas实现物体的点选示例
2022/08/05 Javascript