python爬虫爬取淘宝商品信息


Posted in Python onFebruary 23, 2018

本文实例为大家分享了python爬取淘宝商品的具体代码,供大家参考,具体内容如下

import requests as req 
import re 
 
def getHTMLText(url): 
 try: 
 r = req.get(url, timeout=30) 
 r.raise_for_status() 
 r.encoding = r.apparent_encoding 
 return r.text 
 except: 
 return "" 
 
def parasePage(ilt, html): 
 try: 
 plt = re.findall(r'\"view_price\"\:\"[\d\.]*\"', html) 
 tlt = re.findall(r'\"raw_title\"\:\".*?\"', html) 
 for i in range(len(plt)): 
  price = eval(plt[i].split(':')[1]) 
  title = eval(tlt[i].split(':')[1]) 
  ilt.append([price, title]) 
 except: 
 print("") 
 
 
def printGoodsList(ilt): 
 tplt = "{:4}\t{:8}\t{:16}" 
 print(tplt.format("序列号", "价格", "商品名称")) 
 count = 0 
 for j in ilt: 
 count = count + 1 
 print(tplt.format(count, j[0], j[1])) 
 
def main(): 
 goods = "python爬虫" 
 depth = 3 
 start_url = 'https://s.taobao.com/search?q=' + goods 
 infoList = [] 
 for i in range(depth): 
 try: 
  url = start_url + '&s=' + str(44*i) 
  html = getHTMLText(url) 
  parasePage(infoList, html) 
 except: 
  continue 
 printGoodsList(infoList) 
 
main()

效果图:

python爬虫爬取淘宝商品信息

更多内容请参考专题《python爬取功能汇总》进行学习。

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python命名空间详解
Aug 18 Python
详解Python import方法引入模块的实例
Aug 02 Python
Python正确重载运算符的方法示例详解
Aug 27 Python
Python爬取当当、京东、亚马逊图书信息代码实例
Dec 09 Python
Python OpenCV实现鼠标画框效果
Aug 19 Python
Python3操作Excel文件(读写)的简单实例
Sep 02 Python
python创建学生管理系统
Nov 22 Python
Python编译成.so文件进行加密后调用的实现
Dec 23 Python
python 追踪except信息方式
Apr 25 Python
python3通过udp实现组播数据的发送和接收操作
May 05 Python
Python配置pip国内镜像源的实现
Aug 20 Python
详解Python requests模块
Jun 21 Python
python爬取淘宝商品详情页数据
Feb 23 #Python
Python如何抓取天猫商品详细信息及交易记录
Feb 23 #Python
python列表生成式与列表生成器的使用
Feb 23 #Python
1分钟快速生成用于网页内容提取的xslt
Feb 23 #Python
python使用xslt提取网页数据的方法
Feb 23 #Python
Python爬虫使用Selenium+PhantomJS抓取Ajax和动态HTML内容
Feb 23 #Python
python爬虫获取多页天涯帖子
Feb 23 #Python
You might like
echo(),print(),print_r()之间的区别?
2006/11/19 PHP
PHP设计模式之结构模式的深入解析
2013/06/13 PHP
一个简单的PHP验证码实现代码
2014/05/10 PHP
异步加载技术实现当滚动条到最底部的瀑布流效果
2014/09/16 PHP
PHP之图片上传类实例代码(加了缩略图)
2016/06/30 PHP
学习YUI.Ext 第二天
2007/03/10 Javascript
jquery 批量上传图片实现代码
2010/01/28 Javascript
js下获取div中的数据的原理分析
2010/04/07 Javascript
jQuery 获取对象 基本选择与层级
2010/05/31 Javascript
IE6 fixed的完美解决方案
2011/03/31 Javascript
Yii2使用Bootbox插件实现自定义弹窗
2015/04/02 Javascript
解析javascript中鼠标滚轮事件
2015/05/26 Javascript
浅谈jQuery 中的事件冒泡和阻止默认行为
2016/05/28 Javascript
Bootstrap3 datetimepicker控件使用实例
2016/12/13 Javascript
nodejs搭建本地http服务器教程
2017/03/13 NodeJs
AngularJS 控制器 controller的详解
2017/10/17 Javascript
如何对react hooks进行单元测试的方法
2019/08/14 Javascript
浅谈vue中使用编辑器vue-quill-editor踩过的坑
2020/08/03 Javascript
js实现简单商品筛选功能
2021/02/02 Javascript
Python编码爬坑指南(必看)
2016/06/10 Python
Python OpenCV实现图片上输出中文
2018/01/22 Python
Ubuntu16.04/树莓派Python3+opencv配置教程(分享)
2018/04/02 Python
python邮件发送smtplib使用详解
2020/06/16 Python
关于python2 csv写入空白行的问题
2018/06/22 Python
使用Python生成200个激活码的实现方法
2019/11/22 Python
将matplotlib绘图嵌入pyqt的方法示例
2020/01/08 Python
tensorflow2.0的函数签名与图结构(推荐)
2020/04/28 Python
浅谈pandas dataframe对除数是零的处理
2020/07/20 Python
Pycharm新手使用教程(图文详解)
2020/09/17 Python
利用CSS3实现开门效果实例源码
2016/08/22 HTML / CSS
html5 Canvas画图教程(10)—把面拆成线条模拟出圆角矩形
2013/01/09 HTML / CSS
eBay德国站:eBay.de
2017/09/14 全球购物
波兰家居和花园家具专家:4Home
2019/05/26 全球购物
酒店门卫岗位职责
2013/12/29 职场文书
群众路线教育实践活动对照检查材料
2014/09/22 职场文书
离婚协议书怎么写
2015/01/26 职场文书