python爬虫爬取淘宝商品信息


Posted in Python onFebruary 23, 2018

本文实例为大家分享了python爬取淘宝商品的具体代码,供大家参考,具体内容如下

import requests as req 
import re 
 
def getHTMLText(url): 
 try: 
 r = req.get(url, timeout=30) 
 r.raise_for_status() 
 r.encoding = r.apparent_encoding 
 return r.text 
 except: 
 return "" 
 
def parasePage(ilt, html): 
 try: 
 plt = re.findall(r'\"view_price\"\:\"[\d\.]*\"', html) 
 tlt = re.findall(r'\"raw_title\"\:\".*?\"', html) 
 for i in range(len(plt)): 
  price = eval(plt[i].split(':')[1]) 
  title = eval(tlt[i].split(':')[1]) 
  ilt.append([price, title]) 
 except: 
 print("") 
 
 
def printGoodsList(ilt): 
 tplt = "{:4}\t{:8}\t{:16}" 
 print(tplt.format("序列号", "价格", "商品名称")) 
 count = 0 
 for j in ilt: 
 count = count + 1 
 print(tplt.format(count, j[0], j[1])) 
 
def main(): 
 goods = "python爬虫" 
 depth = 3 
 start_url = 'https://s.taobao.com/search?q=' + goods 
 infoList = [] 
 for i in range(depth): 
 try: 
  url = start_url + '&s=' + str(44*i) 
  html = getHTMLText(url) 
  parasePage(infoList, html) 
 except: 
  continue 
 printGoodsList(infoList) 
 
main()

效果图:

python爬虫爬取淘宝商品信息

更多内容请参考专题《python爬取功能汇总》进行学习。

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python字符串中的单双引
Feb 16 Python
Python分治法定义与应用实例详解
Jul 28 Python
python爬取m3u8连接的视频
Feb 28 Python
Linux下python与C++使用dlib实现人脸检测
Jun 29 Python
python使用Matplotlib绘制分段函数
Sep 25 Python
Python模拟浏览器上传文件脚本的方法(Multipart/form-data格式)
Oct 22 Python
python hbase读取数据发送kafka的方法
Dec 27 Python
手机使用python操作图片文件(pydroid3)过程详解
Sep 25 Python
python模块hashlib(加密服务)知识点讲解
Nov 25 Python
django实现日志按日期分割
May 21 Python
python GUI模拟实现计算器
Jun 22 Python
Django展示可视化图表的多种方式
Apr 08 Python
python爬取淘宝商品详情页数据
Feb 23 #Python
Python如何抓取天猫商品详细信息及交易记录
Feb 23 #Python
python列表生成式与列表生成器的使用
Feb 23 #Python
1分钟快速生成用于网页内容提取的xslt
Feb 23 #Python
python使用xslt提取网页数据的方法
Feb 23 #Python
Python爬虫使用Selenium+PhantomJS抓取Ajax和动态HTML内容
Feb 23 #Python
python爬虫获取多页天涯帖子
Feb 23 #Python
You might like
ThinkPHP3.1新特性之多数据库操作更加完善
2014/06/19 PHP
php数组操作之键名比较与差集、交集赋值的方法
2014/11/10 PHP
PHP实现WebService的简单示例和实现步骤
2015/03/27 PHP
Laravel5.4框架中视图共享数据的方法详解
2019/09/05 PHP
PHPstorm激活码2020年5月13日亲测有效
2020/09/17 PHP
js/html光标定位的实现代码
2013/09/23 Javascript
jquery自动将form表单封装成json的具体实现
2014/03/17 Javascript
JavaScript实现从数组中选出和等于固定值的n个数
2014/09/03 Javascript
js实现数组转换成json
2015/06/26 Javascript
javascript实现base64 md5 sha1 密码加密
2015/09/09 Javascript
gameboy网页闯关游戏(riddle webgame)--仿微信聊天的前端页面设计和难点
2016/02/21 Javascript
通过jquery-ui中的sortable来实现拖拽排序的简单实例
2016/05/24 Javascript
Mvc提交表单的四种方法全程详解
2016/08/10 Javascript
[js高手之路]图解javascript的原型(prototype)对象,原型链实例
2017/08/28 Javascript
Angular 4.0学习教程之架构详解
2017/09/12 Javascript
实例学习JavaScript读取和写入cookie
2018/01/29 Javascript
快速解决vue-cli不能初始化webpack模板的问题
2018/03/20 Javascript
vuejs项目打包之后的首屏加载优化及打包之后出现的问题
2018/04/01 Javascript
Vue通过WebSocket建立长连接的实现代码
2019/11/05 Javascript
python获取图片颜色信息的方法
2015/03/18 Python
取numpy数组的某几行某几列方法
2018/04/03 Python
使用Python计算玩彩票赢钱概率
2019/06/26 Python
python 利用浏览器 Cookie 模拟登录的用户访问知乎的方法
2019/07/11 Python
画pytorch模型图,以及参数计算的方法
2019/08/17 Python
解决pycharm同一目录下无法import其他文件
2020/02/12 Python
Django 设置admin后台表和App(应用)为中文名的操作方法
2020/05/10 Python
施华洛世奇美国官网:SWAROVSKI美国
2018/02/08 全球购物
某公司Java工程师面试题笔试题
2016/03/27 面试题
历史专业毕业生的自我鉴定
2013/11/15 职场文书
社区志愿者活动方案
2014/08/18 职场文书
小学二年级数学教学计划
2015/01/20 职场文书
起诉书范文
2015/05/20 职场文书
将图片保存到mysql数据库并展示在前端页面的实现代码
2021/05/02 MySQL
win11怎么用快捷键锁屏? windows11锁屏的几种方法
2021/11/21 数码科技
Python数据可视化之Seaborn的安装及使用
2022/04/19 Python
python中validators库的使用方法详解
2022/09/23 Python