python抓取京东价格分析京东商品价格走势


Posted in Python onJanuary 09, 2014
from creepy import Crawler
from BeautifulSoup import BeautifulSoup
import urllib2
import json
class MyCrawler(Crawler):
    def process_document(self, doc):
        if doc.status == 200:
            print '[%d] %s' % (doc.status, doc.url)
            try:
                soup = BeautifulSoup(doc.text.decode('gb18030').encode('utf-8'))
            except Exception as e:
                print e
                soup = BeautifulSoup(doc.text)
            print soup.find(id="product-intro").div.h1.text
            url_id=urllib2.unquote(doc.url).decode('utf8').split('/')[-1].split('.')[0]
            f = urllib2.urlopen('http://p.3.cn/prices/get?skuid=J_'+url_id,timeout=5)
            price=json.loads(f.read())
            f.close()
            print price[0]['p']
        else:
            pass
crawler = MyCrawler()
crawler.set_follow_mode(Crawler.F_SAME_HOST)
crawler.set_concurrency_level(16)
crawler.add_url_filter('\.(jpg|jpeg|gif|png|js|css|swf)$')
crawler.crawl('http://item.jd.com/982040.html')
Python 相关文章推荐
python实现清屏的方法
Apr 30 Python
Python对数据库操作
Mar 28 Python
Python中单、双下划线的区别总结
Dec 01 Python
使用pip发布Python程序的方法步骤
Oct 11 Python
Python实现查找二叉搜索树第k大的节点功能示例
Jan 24 Python
python实现合并两个排序的链表
Mar 03 Python
Python学习笔记之pandas索引列、过滤、分组、求和功能示例
Jun 03 Python
Python+Selenium使用Page Object实现页面自动化测试
Jul 14 Python
浅析PyTorch中nn.Linear的使用
Aug 18 Python
Python中Unittest框架的具体使用
Aug 27 Python
Django使用消息提示简单的弹出个对话框实例
Nov 15 Python
keras实现图像预处理并生成一个generator的案例
Jun 17 Python
python实现电子词典
Apr 23 #Python
python中cPickle用法例子分享
Jan 03 #Python
使用python获取CPU和内存信息的思路与实现(linux系统)
Jan 03 #Python
Python群发邮件实例代码
Jan 03 #Python
python切换hosts文件代码示例
Dec 31 #Python
使用Python进行稳定可靠的文件操作详解
Dec 31 #Python
python连接mongodb操作数据示例(mongodb数据库配置类)
Dec 31 #Python
You might like
怎样在php中使用PDF文档功能
2006/10/09 PHP
Windows下利用Gvim写PHP产生中文乱码问题解决方法
2011/04/20 PHP
CI框架中集成CKEditor编辑器的教程
2014/06/09 PHP
php绘制一条弧线的方法
2015/01/24 PHP
PHP查看SSL证书信息的方法
2016/09/22 PHP
php显示页码分页类的封装
2017/06/08 PHP
PHP递归实现汉诺塔问题的方法示例
2017/11/25 PHP
js导出table到excel同时兼容FF和IE示例
2013/09/03 Javascript
JS实现定时页面弹出类似QQ新闻的提示框
2013/11/07 Javascript
只需一行代码,轻松实现一个在线编辑器
2013/11/12 Javascript
js函数调用的方式
2014/05/06 Javascript
Firefox中使用outerHTML的2种解决方法
2014/06/07 Javascript
20条学习javascript的编程规范的建议
2014/11/28 Javascript
jquery实现上下左右滑动的方法
2015/02/09 Javascript
js实现表单多按钮提交action的处理方法
2015/10/24 Javascript
js无法获取到html标签的属性的解决方法
2016/07/26 Javascript
vue日期组件 支持vue1.0和2.0
2017/01/09 Javascript
js实现交通灯效果
2017/01/13 Javascript
详解JS中的立即执行函数
2017/02/24 Javascript
node打造微信个人号机器人的方法示例
2018/04/26 Javascript
javascript中函数的写法实例代码详解
2018/10/28 Javascript
微信小程序如何调用新闻接口实现列表循环
2019/07/02 Javascript
MockJs结合json-server模拟后台数据
2020/08/26 Javascript
javascript 原型与原型链的理解及应用实例分析
2020/02/10 Javascript
[00:35]TI7不朽珍藏III——寒冰飞龙不朽展示
2017/07/15 DOTA
Windows8下安装Python的BeautifulSoup
2015/01/22 Python
Python聚类算法之凝聚层次聚类实例分析
2015/11/20 Python
Python实现的多线程同步与互斥锁功能示例
2017/11/30 Python
Python中super函数用法实例分析
2019/03/18 Python
Airbnb爱彼迎官网:成为爱彼迎房东,赚取收入
2019/03/14 全球购物
在对linux系统分区进行格式化时需要对磁盘簇(或i节点密度)的大小进行选择,请说明选择的原则
2012/11/24 面试题
医药销售自荐书
2014/05/29 职场文书
医德医风个人工作总结2014
2014/11/14 职场文书
公司2015年终工作总结
2015/05/26 职场文书
oracle DGMGRL ORA-16603报错的解决方法(DG Broker)
2021/04/06 Oracle
Python实现的扫码工具居然这么好用!
2021/06/07 Python