python抓取京东价格分析京东商品价格走势


Posted in Python onJanuary 09, 2014
from creepy import Crawler
from BeautifulSoup import BeautifulSoup
import urllib2
import json
class MyCrawler(Crawler):
    def process_document(self, doc):
        if doc.status == 200:
            print '[%d] %s' % (doc.status, doc.url)
            try:
                soup = BeautifulSoup(doc.text.decode('gb18030').encode('utf-8'))
            except Exception as e:
                print e
                soup = BeautifulSoup(doc.text)
            print soup.find(id="product-intro").div.h1.text
            url_id=urllib2.unquote(doc.url).decode('utf8').split('/')[-1].split('.')[0]
            f = urllib2.urlopen('http://p.3.cn/prices/get?skuid=J_'+url_id,timeout=5)
            price=json.loads(f.read())
            f.close()
            print price[0]['p']
        else:
            pass
crawler = MyCrawler()
crawler.set_follow_mode(Crawler.F_SAME_HOST)
crawler.set_concurrency_level(16)
crawler.add_url_filter('\.(jpg|jpeg|gif|png|js|css|swf)$')
crawler.crawl('http://item.jd.com/982040.html')
Python 相关文章推荐
Python编程实战之Oracle数据库操作示例
Jun 21 Python
Python3.4实现从HTTP代理网站批量获取代理并筛选的方法示例
Sep 26 Python
python正则表达式面试题解答
Apr 28 Python
完美解决Python matplotlib绘图时汉字显示不正常的问题
Jan 29 Python
numpy基础教程之np.linalg
Feb 12 Python
对Python协程之异步同步的区别详解
Feb 19 Python
python实现统计代码行数的小工具
Sep 19 Python
使用Python制作缩放自如的圣诞老人(圣诞树)
Dec 25 Python
Python通过TensorFLow进行线性模型训练原理与实现方法详解
Jan 15 Python
opencv 图像礼帽和图像黑帽的实现
Jul 07 Python
python3使用diagrams绘制架构图的步骤
Apr 08 Python
golang特有程序结构入门教程
Jun 02 Python
python实现电子词典
Apr 23 #Python
python中cPickle用法例子分享
Jan 03 #Python
使用python获取CPU和内存信息的思路与实现(linux系统)
Jan 03 #Python
Python群发邮件实例代码
Jan 03 #Python
python切换hosts文件代码示例
Dec 31 #Python
使用Python进行稳定可靠的文件操作详解
Dec 31 #Python
python连接mongodb操作数据示例(mongodb数据库配置类)
Dec 31 #Python
You might like
谈谈关于php的优点与缺点
2013/04/11 PHP
php使用curl抓取qq空间的访客信息示例
2014/02/28 PHP
一个简洁实用的PHP缓存类完整实例
2014/07/26 PHP
php实现插入数组但不影响原有顺序的方法
2015/03/27 PHP
PHP5.3连接Oracle客户端及PDO_OCI模块的安装方法
2016/05/13 PHP
PHP基于cookie实现统计在线人数功能示例
2019/01/16 PHP
jQuery 连续列表实现代码
2009/12/21 Javascript
CSS和JS标签style属性对照表(方便js开发的朋友)
2010/11/11 Javascript
JavaScript lastIndexOf方法入门实例(计算指定字符在字符串中最后一次出现的位置)
2014/10/17 Javascript
js正则表达式中exec用法实例
2015/07/23 Javascript
jQuery实现为控件添加水印文字效果(附源码)
2015/12/02 Javascript
jQuery获得字体颜色16位码的方法
2016/02/20 Javascript
浅析js绑定事件的常用方法
2016/05/15 Javascript
jQuery实现简单漂亮的Nav导航菜单效果
2017/03/29 jQuery
在layui.use 中自定义 function 的正确方法
2019/09/16 Javascript
微信小程序防止多次点击跳转(函数节流)
2019/09/19 Javascript
理解Proxy及使用Proxy实现vue数据双向绑定操作
2020/07/18 Javascript
用Python脚本来删除指定容量以上的文件的教程
2015/05/04 Python
Python内建数据结构详解
2016/02/03 Python
python 将md5转为16字节的方法
2018/05/29 Python
python 异步async库的使用说明
2020/05/04 Python
python 实现读取csv数据,分类求和 再写进 csv
2020/05/18 Python
python框架flask入门之路由及简单实现方法
2020/06/07 Python
Html5+CSS3+EL表达式问题小结
2020/12/19 HTML / CSS
Hotels.com英国:全球领先的酒店住宿提供商
2019/01/24 全球购物
Overload和Override的区别
2012/09/02 面试题
小学生开学感言
2014/02/28 职场文书
合同协议书格式
2014/04/18 职场文书
个人担保书格式范文
2014/05/12 职场文书
保险内勤岗位职责
2015/04/13 职场文书
校长一岗双责责任书
2015/05/09 职场文书
入团介绍人意见范文
2015/06/04 职场文书
环境卫生标语
2015/08/03 职场文书
学校少先队工作总结
2015/08/12 职场文书
彩虹社八名人气艺人全新周边限时推出,性转女装男装一次拥有!
2022/04/01 日漫
Win10开机修复磁盘错误怎么跳过?Win10关闭开机磁盘检查的方法
2022/09/23 数码科技