python抓取京东价格分析京东商品价格走势


Posted in Python onJanuary 09, 2014
from creepy import Crawler
from BeautifulSoup import BeautifulSoup
import urllib2
import json
class MyCrawler(Crawler):
    def process_document(self, doc):
        if doc.status == 200:
            print '[%d] %s' % (doc.status, doc.url)
            try:
                soup = BeautifulSoup(doc.text.decode('gb18030').encode('utf-8'))
            except Exception as e:
                print e
                soup = BeautifulSoup(doc.text)
            print soup.find(id="product-intro").div.h1.text
            url_id=urllib2.unquote(doc.url).decode('utf8').split('/')[-1].split('.')[0]
            f = urllib2.urlopen('http://p.3.cn/prices/get?skuid=J_'+url_id,timeout=5)
            price=json.loads(f.read())
            f.close()
            print price[0]['p']
        else:
            pass
crawler = MyCrawler()
crawler.set_follow_mode(Crawler.F_SAME_HOST)
crawler.set_concurrency_level(16)
crawler.add_url_filter('\.(jpg|jpeg|gif|png|js|css|swf)$')
crawler.crawl('http://item.jd.com/982040.html')
Python 相关文章推荐
python实现问号表达式(?)的方法
Nov 27 Python
Python编写百度贴吧的简单爬虫
Apr 02 Python
Python的Flask框架中集成CKeditor富文本编辑器的教程
Jun 13 Python
Python中getattr函数和hasattr函数作用详解
Jun 14 Python
Windows下Anaconda2安装NLTK教程
Sep 19 Python
Python实现的对本地host127.0.0.1主机进行扫描端口功能示例
Feb 15 Python
python调用Matplotlib绘制分布点图
Oct 18 Python
python logging添加filter教程
Dec 24 Python
pytorch方法测试——激活函数(ReLU)详解
Jan 15 Python
Python3 selenium 实现QQ群接龙自动化功能
Apr 17 Python
keras 自定义loss损失函数,sample在loss上的加权和metric详解
May 23 Python
用python对excel查重
Dec 07 Python
python实现电子词典
Apr 23 #Python
python中cPickle用法例子分享
Jan 03 #Python
使用python获取CPU和内存信息的思路与实现(linux系统)
Jan 03 #Python
Python群发邮件实例代码
Jan 03 #Python
python切换hosts文件代码示例
Dec 31 #Python
使用Python进行稳定可靠的文件操作详解
Dec 31 #Python
python连接mongodb操作数据示例(mongodb数据库配置类)
Dec 31 #Python
You might like
PHP操作文件方法问答
2007/03/16 PHP
Php Ctemplate引擎开发相关内容
2012/03/03 PHP
PHP错误WARNING: SESSION_START() [FUNCTION.SESSION-START]解决方法
2014/05/04 PHP
PHP如何实现跨域
2016/05/30 PHP
php compact 通过变量创建数组
2016/11/15 PHP
基于ThinkPHP5.0实现图片上传插件
2017/09/25 PHP
JavaScript 新手24条实用建议[TUTS+]
2009/06/21 Javascript
js 刷新页面的代码小结 推荐
2010/04/02 Javascript
js 数据类型转换总结笔记
2011/01/17 Javascript
Jquery 获取checkbox的checked问题
2011/11/16 Javascript
Extjs4 消息框去掉关闭按钮(类似Ext.Msg.alert)
2013/04/02 Javascript
基于jquery实现放大镜效果
2015/08/17 Javascript
JS实现双击屏幕滚动效果代码
2015/10/28 Javascript
JS实现表单多文件上传样式美化支持选中文件后删除相关项
2016/09/30 Javascript
JavaScript中关键字 in 的使用方法详解
2016/10/17 Javascript
用headjs来管理和加载js 提高网站加载速度
2016/11/29 Javascript
在Vue中使用echarts的方法
2018/02/05 Javascript
使用vue-router beforEach实现判断用户登录跳转路由筛选功能
2018/06/25 Javascript
vue elementUI table 自定义表头和行合并的实例代码
2019/05/22 Javascript
通过python+selenium3实现浏览器刷简书文章阅读量
2017/12/26 Python
python opencv 图像尺寸变换方法
2018/04/02 Python
Python实现简单的文本相似度分析操作详解
2018/06/16 Python
python绘图模块matplotlib示例详解
2019/07/26 Python
python生成器/yield协程/gevent写简单的图片下载器功能示例
2019/10/28 Python
Python 内置函数globals()和locals()对比详解
2019/12/23 Python
解决matplotlib.pyplot在Jupyter notebook中不显示图像问题
2020/04/22 Python
python 邮件检测工具mmpi的使用
2021/01/04 Python
CSS3中的元素过渡属性transition示例详解
2016/11/30 HTML / CSS
荷兰多品牌网上鞋店:Stoute Schoenen
2017/08/24 全球购物
J2ee常用的设计模式?说明工厂模式
2015/05/21 面试题
行政助理的职责
2013/11/14 职场文书
前厅收银主管岗位职责
2014/02/04 职场文书
协议书模板
2014/04/23 职场文书
企业文化口号
2014/06/12 职场文书
求职自荐信怎么写
2015/03/04 职场文书
升职自荐信怎么写
2015/03/05 职场文书