python抓取京东商城手机列表url实例代码


Posted in Python onDecember 18, 2013
#-*- coding: UTF-8 -*-
'''
Created on 2013-12-5
@author: good-temper
'''
import urllib2
import bs4
import time
def getPage(urlStr):
    '''
                获取页面内容
    '''
    content = urllib2.urlopen(urlStr).read()
    return content
def getNextPageUrl(currPageNum):
    #http://list.jd.com/9987-653-655-0-0-0-0-0-0-0-1-1-页码-1-1-72-4137-33.html
    url =  u'http://list.jd.com/9987-653-655-0-0-0-0-0-0-0-1-1-'+str(currPageNum+1)+'-1-1-72-4137-33.html'
    #是否有下一页
    content = getPage(url);
    soup = bs4.BeautifulSoup(content)
    list = soup.findAll('span',{'class':'next-disabled'});
    if(len(list) == 0):
        return url
    return ''
def analyzeList():
    pageNum = 0
    list = []
    url = getNextPageUrl(pageNum)
    while url !='':
        soup = bs4.BeautifulSoup(getPage(url))
        pagelist = soup.findAll('div',{'class':'p-name'})
        for elem in pagelist:
            soup1 =  bs4.BeautifulSoup(str(elem))
            list.append(soup1.find('a')['href'])
        pageNum = pageNum+1
        print pageNum
        url = getNextPageUrl(pageNum)
    return list
def analyzeContent(url):
    return ''
def writeToFile(list, path):
    f = open(path, 'a')
    for elem in list:
        f.write(elem+'\n')
    f.close()
if __name__ == '__main__':
    list = analyzeList()
    print '共抓取'+str(len(list))+'条\n'
    writeToFile(list, u'E:\\jd_phone_list.dat');
Python 相关文章推荐
python中string模块各属性以及函数的用法介绍
May 30 Python
python中利用await关键字如何等待Future对象完成详解
Sep 07 Python
Python实现的列表排序、反转操作示例
Mar 13 Python
Python+PyQt5实现美剧爬虫可视工具的方法
Apr 25 Python
python实现抽奖小程序
Apr 15 Python
pyinstaller打包opencv和numpy程序运行错误解决
Aug 16 Python
PyQt+socket实现远程操作服务器的方法示例
Aug 22 Python
详解使用django-mama-cas快速搭建CAS服务的实现
Oct 30 Python
基于Python和PyYAML读取yaml配置文件数据
Jan 13 Python
python+pygame实现坦克大战小游戏的示例代码(可以自定义子弹速度)
Aug 11 Python
Python发送邮件实现基础解析
Aug 14 Python
python 基于opencv操作摄像头
Dec 24 Python
python获取糗百图片代码实例
Dec 18 #Python
python算法学习之计数排序实例
Dec 18 #Python
python算法学习之基数排序实例
Dec 18 #Python
python算法学习之桶排序算法实例(分块排序)
Dec 18 #Python
python计算最大优先级队列实例
Dec 18 #Python
python计算最小优先级队列代码分享
Dec 18 #Python
python查找第k小元素代码分享
Dec 18 #Python
You might like
全新的PDO数据库操作类php版(仅适用Mysql)
2012/07/22 PHP
使用laravel的Eloquent模型如何获取数据库的指定列
2019/10/17 PHP
基于jQuery实现下拉收缩(展开与折叠)特效
2012/12/25 Javascript
侧栏跟随滚动的简单实现代码
2013/03/18 Javascript
jQuery把表单元素变为json对象
2013/11/06 Javascript
JS OffsetParent属性深入解析
2014/01/13 Javascript
jQuery超赞的评分插件(8款)
2015/08/20 Javascript
JS禁用页面上所有控件的实现方法(附demo源码下载)
2015/12/17 Javascript
Javascript对象字面量的理解
2016/06/22 Javascript
AngularJs  Understanding Angular Templates
2016/09/02 Javascript
JS日期对象简单操作(获取当前年份、星期、时间)
2016/10/26 Javascript
解析利用javascript如何判断一个数为素数
2016/12/08 Javascript
浅谈js中的变量名和函数名重名
2017/02/13 Javascript
webpack独立打包和缓存处理详解
2017/04/03 Javascript
js时间戳与日期格式之间相互转换
2017/12/11 Javascript
[52:20]DOTA2-DPC中国联赛正赛 SAG vs XGBO3 第一场 3月5日
2021/03/11 DOTA
用Python实现随机森林算法的示例
2017/08/24 Python
Python将列表数据写入文件(txt, csv,excel)
2019/04/03 Python
详解如何设置Python环境变量?
2019/05/13 Python
Python any()函数的使用方法
2019/10/28 Python
python模块hashlib(加密服务)知识点讲解
2019/11/25 Python
TensorFlow2.X使用图片制作简单的数据集训练模型
2020/04/08 Python
利用python绘制数据曲线图的实现
2020/04/09 Python
class类在python中获取金融数据的实例方法
2020/12/10 Python
iframe与window.onload如何使用详解
2020/05/07 HTML / CSS
JD Sports瑞典:英国领先的运动时尚商店
2018/01/28 全球购物
介绍一下Python中webbrowser的用法
2013/05/07 面试题
护士自我鉴定范文
2013/10/06 职场文书
人事专员岗位职责
2013/11/20 职场文书
出纳员的岗位职责
2014/02/22 职场文书
环境保护建议书
2014/08/26 职场文书
领导批评与自我批评范文
2014/10/16 职场文书
医学专业大学生职业生涯规划书
2014/10/25 职场文书
先进基层党组织主要事迹材料
2015/11/03 职场文书
mysql主从复制的实现步骤
2021/10/24 MySQL
PostgreSQL13基于流复制搭建后备服务器的方法
2022/01/18 PostgreSQL