python抓取京东商城手机列表url实例代码


Posted in Python onDecember 18, 2013
#-*- coding: UTF-8 -*-
'''
Created on 2013-12-5
@author: good-temper
'''
import urllib2
import bs4
import time
def getPage(urlStr):
    '''
                获取页面内容
    '''
    content = urllib2.urlopen(urlStr).read()
    return content
def getNextPageUrl(currPageNum):
    #http://list.jd.com/9987-653-655-0-0-0-0-0-0-0-1-1-页码-1-1-72-4137-33.html
    url =  u'http://list.jd.com/9987-653-655-0-0-0-0-0-0-0-1-1-'+str(currPageNum+1)+'-1-1-72-4137-33.html'
    #是否有下一页
    content = getPage(url);
    soup = bs4.BeautifulSoup(content)
    list = soup.findAll('span',{'class':'next-disabled'});
    if(len(list) == 0):
        return url
    return ''
def analyzeList():
    pageNum = 0
    list = []
    url = getNextPageUrl(pageNum)
    while url !='':
        soup = bs4.BeautifulSoup(getPage(url))
        pagelist = soup.findAll('div',{'class':'p-name'})
        for elem in pagelist:
            soup1 =  bs4.BeautifulSoup(str(elem))
            list.append(soup1.find('a')['href'])
        pageNum = pageNum+1
        print pageNum
        url = getNextPageUrl(pageNum)
    return list
def analyzeContent(url):
    return ''
def writeToFile(list, path):
    f = open(path, 'a')
    for elem in list:
        f.write(elem+'\n')
    f.close()
if __name__ == '__main__':
    list = analyzeList()
    print '共抓取'+str(len(list))+'条\n'
    writeToFile(list, u'E:\\jd_phone_list.dat');
Python 相关文章推荐
Python实现二分查找算法实例
May 26 Python
Python实现简单的HttpServer服务器示例
Sep 25 Python
python 计算数组中每个数字出现多少次--“Bucket”桶的思想
Dec 19 Python
Python实现读取txt文件并转换为excel的方法示例
May 17 Python
Python3.4学习笔记之列表、数组操作示例
Mar 01 Python
用pyqt5 给按钮设置图标和css样式的方法
Jun 24 Python
图文详解Django使用Pycharm连接MySQL数据库
Aug 09 Python
Python openpyxl读取单元格字体颜色过程解析
Sep 03 Python
python实现银行管理系统
Oct 25 Python
Python Pandas 对列/行进行选择,增加,删除操作
May 17 Python
Python日志处理模块logging用法解析
May 19 Python
用python 绘制茎叶图和复合饼图
Feb 26 Python
python获取糗百图片代码实例
Dec 18 #Python
python算法学习之计数排序实例
Dec 18 #Python
python算法学习之基数排序实例
Dec 18 #Python
python算法学习之桶排序算法实例(分块排序)
Dec 18 #Python
python计算最大优先级队列实例
Dec 18 #Python
python计算最小优先级队列代码分享
Dec 18 #Python
python查找第k小元素代码分享
Dec 18 #Python
You might like
windows下配置php5.5开发环境及开发扩展
2014/12/25 PHP
PHP简单实现断点续传下载的方法
2015/09/25 PHP
浅谈JavaScript中面向对象技术的模拟
2006/09/25 Javascript
jquery text()要注意啦
2009/10/30 Javascript
JavaScript是否可实现多线程  深入理解JavaScript定时机制
2009/12/22 Javascript
javascript innerText和innerHtml应用
2010/01/28 Javascript
javascript Firefox与IE 替换节点的方法
2010/02/24 Javascript
js中点击空白区域时文本框与隐藏层的显示与影藏问题
2013/08/26 Javascript
jquery手风琴特效插件
2015/02/04 Javascript
javaScript语法总结
2016/11/25 Javascript
JS前向后瞻正则表达式定义与用法示例
2016/12/27 Javascript
JavaScript事件方法(实例讲解)
2017/06/27 Javascript
vue 页面加载进度条组件实例
2018/02/05 Javascript
node.js学习笔记之koa框架和简单爬虫练习
2018/12/13 Javascript
jQuery 筛选器简单操作示例
2019/10/02 jQuery
js实现二级联动简单实例
2020/01/11 Javascript
antd Select下拉菜单动态添加option里的内容操作
2020/11/02 Javascript
Python中if __name__ == "__main__"详细解释
2014/10/21 Python
Python函数式编程指南(三):迭代器详解
2015/06/24 Python
Python实现的弹球小游戏示例
2017/08/01 Python
python logging日志模块的详解
2017/10/29 Python
python如何获取列表中每个元素的下标位置
2019/07/01 Python
Django app配置多个数据库代码实例
2019/12/17 Python
利用setuptools打包python程序的方法步骤
2020/01/18 Python
连卡佛中国官网:Lane Crawford中文站
2018/01/27 全球购物
英国珠宝钟表和家居礼品精品店:David Shuttle
2018/02/24 全球购物
美国二手复古奢侈品包包购物网站:LXRandCo
2019/06/18 全球购物
Charles&Keith美国官方网站:新加坡快时尚鞋类和配饰零售商
2019/11/27 全球购物
Zalando Lounge瑞士:时尚与生活方式购物俱乐部
2020/03/12 全球购物
市场营销战略计划书
2014/05/06 职场文书
社团活动总结书
2014/06/27 职场文书
幼儿园社区活动总结
2014/07/07 职场文书
好的促销活动方案
2014/08/21 职场文书
质量月活动总结
2014/08/26 职场文书
妈妈别哭观后感
2015/06/08 职场文书
vue基于Teleport实现Modal组件
2021/05/31 Vue.js