python抓取京东商城手机列表url实例代码


Posted in Python onDecember 18, 2013
#-*- coding: UTF-8 -*-
'''
Created on 2013-12-5
@author: good-temper
'''
import urllib2
import bs4
import time
def getPage(urlStr):
    '''
                获取页面内容
    '''
    content = urllib2.urlopen(urlStr).read()
    return content
def getNextPageUrl(currPageNum):
    #http://list.jd.com/9987-653-655-0-0-0-0-0-0-0-1-1-页码-1-1-72-4137-33.html
    url =  u'http://list.jd.com/9987-653-655-0-0-0-0-0-0-0-1-1-'+str(currPageNum+1)+'-1-1-72-4137-33.html'
    #是否有下一页
    content = getPage(url);
    soup = bs4.BeautifulSoup(content)
    list = soup.findAll('span',{'class':'next-disabled'});
    if(len(list) == 0):
        return url
    return ''
def analyzeList():
    pageNum = 0
    list = []
    url = getNextPageUrl(pageNum)
    while url !='':
        soup = bs4.BeautifulSoup(getPage(url))
        pagelist = soup.findAll('div',{'class':'p-name'})
        for elem in pagelist:
            soup1 =  bs4.BeautifulSoup(str(elem))
            list.append(soup1.find('a')['href'])
        pageNum = pageNum+1
        print pageNum
        url = getNextPageUrl(pageNum)
    return list
def analyzeContent(url):
    return ''
def writeToFile(list, path):
    f = open(path, 'a')
    for elem in list:
        f.write(elem+'\n')
    f.close()
if __name__ == '__main__':
    list = analyzeList()
    print '共抓取'+str(len(list))+'条\n'
    writeToFile(list, u'E:\\jd_phone_list.dat');
Python 相关文章推荐
python导入csv文件出现SyntaxError问题分析
Dec 15 Python
Python实现PS滤镜中马赛克效果示例
Jan 20 Python
对python中的logger模块全面讲解
Apr 28 Python
python实现搜索文本文件内容脚本
Jun 22 Python
pyQT5 实现窗体之间传值的示例
Jun 20 Python
python 求某条线上特定x值或y值的点坐标方法
Jul 09 Python
python通过http下载文件的方法详解
Jul 26 Python
Python使用scrapy爬取阳光热线问政平台过程解析
Aug 14 Python
Python数据分析pandas模块用法实例详解
Nov 20 Python
Django框架中间件定义与使用方法案例分析
Nov 28 Python
基于django2.2连oracle11g解决版本冲突的问题
Jul 02 Python
Python APScheduler执行使用方法详解
Dec 10 Python
python获取糗百图片代码实例
Dec 18 #Python
python算法学习之计数排序实例
Dec 18 #Python
python算法学习之基数排序实例
Dec 18 #Python
python算法学习之桶排序算法实例(分块排序)
Dec 18 #Python
python计算最大优先级队列实例
Dec 18 #Python
python计算最小优先级队列代码分享
Dec 18 #Python
python查找第k小元素代码分享
Dec 18 #Python
You might like
十大催泪虐心动漫电影,有几部你还没看
2020/03/04 日漫
PHP经典的给图片加水印程序
2006/12/06 PHP
php汉字转拼音的示例
2014/02/27 PHP
ThinkPHP单字母函数(快捷方法)使用总结
2014/07/23 PHP
你可能不再需要JQUERY
2021/03/09 Javascript
JS中Location使用详解
2015/05/12 Javascript
angularjs自定义ng-model标签的属性
2016/01/21 Javascript
JavaScript中的Object对象学习教程
2016/05/20 Javascript
javascript实现瀑布流动态加载图片原理
2016/08/12 Javascript
Javascript使用SWFUpload进行多文件上传
2016/11/16 Javascript
AngularJS之自定义服务详解(factory、service、provider)
2017/04/14 Javascript
vue2.0设置proxyTable使用axios进行跨域请求的方法
2017/10/19 Javascript
nodejs读取并去重excel文件
2018/04/22 NodeJs
小程序实现留言板
2018/11/02 Javascript
Vue调用后端java接口的实例代码
2019/10/28 Javascript
js prototype深入理解及应用实例分析
2019/11/25 Javascript
vue点击Dashboard不同内容 跳转到同一表格的实例
2020/11/13 Javascript
详解微信小程序「渲染层网络层错误」的解决方法
2021/01/06 Javascript
[48:05]2018DOTA2亚洲邀请赛 3.31 小组赛 B组 VGJ.T vs VP
2018/03/31 DOTA
[01:18:33]Secret vs VGJ.S Supermajor小组赛C组 BO3 第一场 6.3
2018/06/04 DOTA
Python中join函数简单代码示例
2018/01/09 Python
python实现批量图片格式转换
2020/06/16 Python
VPS CENTOS 上配置python,mysql,nginx,uwsgi,django的方法详解
2019/07/01 Python
使用Fabric自动化部署Django项目的实现
2019/09/27 Python
Python实现RGB与HSI颜色空间的互换方式
2019/11/27 Python
浅谈Python中的异常和JSON读写数据的实现
2020/02/27 Python
美国电视购物HSN官网:HSN
2016/09/07 全球购物
css animation配合SVG制作能量流动效果
2021/03/24 HTML / CSS
新闻专业推荐信范文
2013/11/20 职场文书
教师现实表现材料
2014/02/14 职场文书
借款担保书范文
2014/05/13 职场文书
体育口号大全
2014/06/18 职场文书
乡镇党员干部群众路线对照检查材料思想汇报
2014/09/28 职场文书
初中英语教学随笔
2015/08/15 职场文书
2016年度继续教育学习心得体会
2016/01/19 职场文书
简单了解 MySQL 中相关的锁
2021/05/25 MySQL