python抓取京东价格分析京东商品价格走势


Posted in Python onJanuary 09, 2014
from creepy import Crawler
from BeautifulSoup import BeautifulSoup
import urllib2
import json
class MyCrawler(Crawler):
    def process_document(self, doc):
        if doc.status == 200:
            print '[%d] %s' % (doc.status, doc.url)
            try:
                soup = BeautifulSoup(doc.text.decode('gb18030').encode('utf-8'))
            except Exception as e:
                print e
                soup = BeautifulSoup(doc.text)
            print soup.find(id="product-intro").div.h1.text
            url_id=urllib2.unquote(doc.url).decode('utf8').split('/')[-1].split('.')[0]
            f = urllib2.urlopen('http://p.3.cn/prices/get?skuid=J_'+url_id,timeout=5)
            price=json.loads(f.read())
            f.close()
            print price[0]['p']
        else:
            pass
crawler = MyCrawler()
crawler.set_follow_mode(Crawler.F_SAME_HOST)
crawler.set_concurrency_level(16)
crawler.add_url_filter('\.(jpg|jpeg|gif|png|js|css|swf)$')
crawler.crawl('http://item.jd.com/982040.html')
Python 相关文章推荐
Python常见数据结构详解
Jul 24 Python
django实现分页的方法
May 26 Python
在arcgis使用python脚本进行字段计算时是如何解决中文问题的
Oct 18 Python
Tensorflow加载预训练模型和保存模型的实例
Jul 27 Python
Python3.7 新特性之dataclass装饰器
May 27 Python
python3多线程知识点总结
Sep 26 Python
Python绘制二维曲线的日常应用详解
Dec 04 Python
Jupyter Notebook的连接密码 token查询方式
Apr 21 Python
Python爬虫实例——scrapy框架爬取拉勾网招聘信息
Jul 14 Python
Python实现LR1文法的完整实例代码
Oct 25 Python
基于python实现坦克大战游戏
Oct 27 Python
简单介绍Python的第三方库yaml
Jun 18 Python
python实现电子词典
Apr 23 #Python
python中cPickle用法例子分享
Jan 03 #Python
使用python获取CPU和内存信息的思路与实现(linux系统)
Jan 03 #Python
Python群发邮件实例代码
Jan 03 #Python
python切换hosts文件代码示例
Dec 31 #Python
使用Python进行稳定可靠的文件操作详解
Dec 31 #Python
python连接mongodb操作数据示例(mongodb数据库配置类)
Dec 31 #Python
You might like
PHP一些常用的正则表达式字符的一些转换
2008/07/29 PHP
PHP中strnatcmp()函数“自然排序算法”进行字符串比较用法分析(对比strcmp函数)
2016/01/07 PHP
ThinkPHP 模板引擎使用详解
2017/05/07 PHP
PHP实现登录注册之BootStrap表单功能
2017/09/03 PHP
PHP中递归的实现实例详解
2017/11/14 PHP
PHP常用字符串输出方法分析(echo,print,printf及sprintf)
2021/03/09 PHP
Nigma vs Liquid BO3 第一场2.13
2021/03/10 DOTA
javascript中的107个基础知识收集整理 推荐
2010/03/29 Javascript
html5 canvas js(数字时钟)实例代码
2013/12/23 Javascript
js Object2String方便查看js对象内容
2014/11/24 Javascript
JavaScript中switch语句的用法详解
2015/06/03 Javascript
全面解析Bootstrap中tooltip、popover的使用方法
2016/06/13 Javascript
用jQuery实现可输入多选下拉组合框实例代码
2017/01/18 Javascript
react-router4 嵌套路由的使用方法
2017/07/24 Javascript
React为 Vue 引入容器组件和展示组件的教程详解
2018/05/03 Javascript
vue构建动态表单的方法示例
2018/09/22 Javascript
angularJS1 url中携带参数的获取方法
2018/10/09 Javascript
浅谈vue中关于checkbox数据绑定v-model指令的个人理解
2018/11/14 Javascript
vue拖拽排序插件vuedraggable使用方法详解
2020/08/21 Javascript
vue动态注册组件实例代码详解
2019/05/30 Javascript
JS+canvas五子棋人机对战实现步骤详解
2020/06/04 Javascript
Vuex的热更替如何实现
2020/06/05 Javascript
利用python爬取散文网的文章实例教程
2017/06/18 Python
python微信公众号开发简单流程实现
2020/03/09 Python
python编写实现抽奖器
2020/09/10 Python
使用html5实现表格实现标题合并的实例代码
2019/05/13 HTML / CSS
工作表现自我评价
2014/02/08 职场文书
2014年大学庆元旦迎新年活动方案
2014/03/09 职场文书
创先争优个人承诺书
2014/08/30 职场文书
群众路线教育实践活动思想汇报(2014特荐篇)
2014/09/16 职场文书
一份没有按时交货失信于客户的检讨书
2014/09/19 职场文书
会计师事务所实习证明
2014/11/16 职场文书
2014年行政执法工作总结
2014/12/11 职场文书
小学生作文评语集锦
2014/12/25 职场文书
2016年感恩节寄语
2015/12/07 职场文书
MySQL中order by的使用详情
2021/11/17 MySQL