python爬虫爬取淘宝商品信息


Posted in Python onFebruary 23, 2018

本文实例为大家分享了python爬取淘宝商品的具体代码,供大家参考,具体内容如下

import requests as req 
import re 
 
def getHTMLText(url): 
 try: 
 r = req.get(url, timeout=30) 
 r.raise_for_status() 
 r.encoding = r.apparent_encoding 
 return r.text 
 except: 
 return "" 
 
def parasePage(ilt, html): 
 try: 
 plt = re.findall(r'\"view_price\"\:\"[\d\.]*\"', html) 
 tlt = re.findall(r'\"raw_title\"\:\".*?\"', html) 
 for i in range(len(plt)): 
  price = eval(plt[i].split(':')[1]) 
  title = eval(tlt[i].split(':')[1]) 
  ilt.append([price, title]) 
 except: 
 print("") 
 
 
def printGoodsList(ilt): 
 tplt = "{:4}\t{:8}\t{:16}" 
 print(tplt.format("序列号", "价格", "商品名称")) 
 count = 0 
 for j in ilt: 
 count = count + 1 
 print(tplt.format(count, j[0], j[1])) 
 
def main(): 
 goods = "python爬虫" 
 depth = 3 
 start_url = 'https://s.taobao.com/search?q=' + goods 
 infoList = [] 
 for i in range(depth): 
 try: 
  url = start_url + '&s=' + str(44*i) 
  html = getHTMLText(url) 
  parasePage(infoList, html) 
 except: 
  continue 
 printGoodsList(infoList) 
 
main()

效果图:

python爬虫爬取淘宝商品信息

更多内容请参考专题《python爬取功能汇总》进行学习。

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
跟老齐学Python之画圈还不简单吗?
Sep 20 Python
python+pyqt实现12306图片验证效果
Oct 25 Python
Python OpenCV获取视频的方法
Feb 28 Python
Python+PyQt5实现美剧爬虫可视工具的方法
Apr 25 Python
python操作kafka实践的示例代码
Jun 19 Python
Python中那些 Pythonic的写法详解
Jul 02 Python
python实现把二维列表变为一维列表的方法分析
Oct 08 Python
PyCharm 2019.3发布增加了新功能一览
Dec 08 Python
Python内置数据类型list各方法的性能测试过程解析
Jan 07 Python
python微信公众号开发简单流程实现
Mar 09 Python
Python爬虫实现vip电影下载的示例代码
Apr 20 Python
Python控制鼠标键盘代码实例
Dec 08 Python
python爬取淘宝商品详情页数据
Feb 23 #Python
Python如何抓取天猫商品详细信息及交易记录
Feb 23 #Python
python列表生成式与列表生成器的使用
Feb 23 #Python
1分钟快速生成用于网页内容提取的xslt
Feb 23 #Python
python使用xslt提取网页数据的方法
Feb 23 #Python
Python爬虫使用Selenium+PhantomJS抓取Ajax和动态HTML内容
Feb 23 #Python
python爬虫获取多页天涯帖子
Feb 23 #Python
You might like
全国FM电台频率大全 - 29 青海省
2020/03/11 无线电
php获取网页中图片、DIV内容的简单方法
2014/06/19 PHP
PHP 7的一些引人注目的新特性简单介绍
2015/11/08 PHP
php结合redis高并发下发帖、发微博的实现方法
2016/12/15 PHP
Laravel5.5+ 使用API Resources快速输出自定义JSON方法详解
2020/04/06 PHP
php实现断点续传大文件示例代码
2020/06/19 PHP
二级域名转向类
2006/11/09 Javascript
Display SQL Server Version Information
2007/06/21 Javascript
JavaScript入门教程 Cookies
2009/01/31 Javascript
Javascript 原型和继承(Prototypes and Inheritance)
2009/04/01 Javascript
JavaScript OOP面向对象介绍
2010/12/02 Javascript
探讨javascript是不是面向对象的语言
2013/11/21 Javascript
javascript中setTimeout和setInterval的unref()和ref()用法示例
2014/11/26 Javascript
jQuery检查事件是否触发的方法
2015/06/26 Javascript
详解利用exif.js解决ios手机上传竖拍照片旋转90度问题
2016/11/04 Javascript
bootstrap jquery dataTable 异步ajax刷新表格数据的实现方法
2017/02/10 Javascript
jsonp跨域请求实现示例
2017/03/13 Javascript
ES6学习教程之块级作用域详解
2017/10/09 Javascript
VUE饿了么树形控件添加增删改功能的示例代码
2017/10/17 Javascript
vue-cli配置环境变量的方法
2018/07/09 Javascript
angular4自定义表单控件[(ngModel)]的实现
2018/11/23 Javascript
vue强制刷新组件的方法示例
2019/02/28 Javascript
vue 扩展现有组件的操作
2020/08/14 Javascript
微信小程序实现加入购物车滑动轨迹
2020/11/18 Javascript
[00:30]塑造者的传承礼包-戴泽“暗影之焰”套装展示视频
2014/04/04 DOTA
Python中应该使用%还是format来格式化字符串
2018/09/25 Python
dpn网络的pytorch实现方式
2020/01/14 Python
tensorflow使用range_input_producer多线程读取数据实例
2020/01/20 Python
Jupyter 无法下载文件夹如何实现曲线救国
2020/04/22 Python
django创建css文件夹的具体方法
2020/07/31 Python
详解Html5 监听拦截Android返回键方法
2018/04/18 HTML / CSS
Bealls Florida百货商店:生活服饰、家居装饰和鞋子
2018/02/23 全球购物
双立人加拿大官网:Zwilling加拿大
2020/08/10 全球购物
静态成员和非静态成员的区别
2012/05/12 面试题
学雷锋宣传标语
2014/06/25 职场文书
关于群众路线的心得体会
2014/11/05 职场文书