python定向爬取淘宝商品价格


Posted in Python onFebruary 27, 2018

python爬虫学习之定向爬取淘宝商品价格,供大家参考,具体内容如下

import requests
import re

def getHTMLText(url):
  try:
    r = requests.get(url, timeout=30)
    r.raise_for_status() #如果发送了一个失败请求(非200响应),#我们可以通过 Response.raise_for_status() 来抛出异常:
    r.encoding= r.apparent_encoding
    return r.text
  except:
    return ""

def parsePage(ilt,html):
  try:
    plt = re.findall(r'\"view_price\"\:\"[\d\.]*?\"',html) #正则表达式来匹配 "view_price":"\d\."类型的字符串
    tlt = re.findall(r'\"raw_title\"\:\".*?\"',html)
#正则表达式来匹配 "raw_title":".*?"类型的字符串,.*?是任意字符的最小匹配
    for i in range(len(plt)):
      price = eval(plt[i].split(':')[1])
      title = eval(tlt[i].split(':')[1])
      ilt.append([price,title])
  except:
    print ("")


def PrintGoodsList(ilt):
  tplt = "{:4}\t{:8}\t{:16}"
  print (tplt.format("序号","价格","商品名称"))
  count = 0
  for g in ilt:
    count = count + 1
    print (tplt.format(count,g[0],g[1]))
def main():
  goods = '书包'
  depth = 2
  start_url = 'https://s.taobao.com/search?q=' + goods
  infoList=[]
  for i in range(depth):
    try:
      url = start_url + '&s=' + str(44*i)
      html= getHTMLText(url)
      parsePage(infoList,html)
    except:
      continue

  PrintGoodsList(infoList)

main()

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
sqlalchemy对象转dict的示例
Apr 22 Python
理解python多线程(python多线程简明教程)
Jun 09 Python
Python实现将n个点均匀地分布在球面上的方法
Mar 12 Python
python使用pil生成图片验证码的方法
May 08 Python
Win10下Python环境搭建与配置教程
Nov 18 Python
python爬虫的工作原理
Mar 05 Python
深入理解python中的select模块
Apr 23 Python
django和vue实现数据交互的方法
Aug 21 Python
Python中常用的高阶函数实例详解
Feb 21 Python
Python requests.post方法中data与json参数区别详解
Apr 30 Python
查看keras各种网络结构各层的名字方式
Jun 11 Python
聊聊Python String型列表求最值的问题
Jan 18 Python
python抓取文件夹的所有文件
Feb 27 #Python
python数据分析数据标准化及离散化详解
Feb 26 #Python
批量将ppt转换为pdf的Python代码 只要27行!
Feb 26 #Python
python 3利用Dlib 19.7实现摄像头人脸检测特征点标定
Feb 26 #Python
python3利用Dlib19.7实现人脸68个特征点标定
Feb 26 #Python
python微信跳一跳系列之棋子定位颜色识别
Feb 26 #Python
python微信跳一跳系列之棋子定位像素遍历
Feb 26 #Python
You might like
smarty模板嵌套之include与fetch性能测试
2010/12/05 PHP
php实现的任意进制互转类分享
2015/07/07 PHP
PHP简单判断手机设备的方法
2016/08/23 PHP
thinkPHP多语言切换设置方法详解
2016/11/11 PHP
php mysql操作mysql_connect连接数据库实例详解
2016/12/26 PHP
PHP实现批量清空删除指定文件夹所有内容的方法
2017/05/30 PHP
CL vs ForZe BO5 第二场 2.13
2021/03/10 DOTA
javascript 获取表单file全路径
2009/12/31 Javascript
全面理解面向对象的 JavaScript(来自ibm)
2013/11/10 Javascript
jQuery实现仿百度首页滑动伸缩展开的添加服务效果代码
2015/09/09 Javascript
Javascript实现图片加载从模糊到清晰显示的方法
2016/06/21 Javascript
JavaScript学习笔记--常用的互动方法
2016/12/07 Javascript
Angular2里获取(input file)上传文件的内容的方法
2017/09/05 Javascript
Node.js成为Web应用开发最佳选择的原因
2018/02/05 Javascript
Vue 事件处理操作实例详解
2019/03/05 Javascript
js实现表格数据搜索
2020/08/09 Javascript
从零学Python之入门(三)序列
2014/05/25 Python
Python书单 不将就
2017/07/11 Python
python thrift搭建服务端和客户端测试程序
2018/01/17 Python
python如何定义带参数的装饰器
2018/03/20 Python
解决Python网页爬虫之中文乱码问题
2018/05/11 Python
python3.7环境下安装Anaconda的教程图解
2019/09/10 Python
DJANGO-URL反向解析REVERSE实例讲解
2019/10/25 Python
利用python Selenium实现自动登陆京东签到领金币功能
2019/10/31 Python
Reebok俄罗斯官方网上商店:购买锐步运动服装和鞋子
2016/09/26 全球购物
英国假发网站:Hothair
2018/02/23 全球购物
Yankee Candle官网:美国最畅销蜡烛品牌之一
2020/01/05 全球购物
优秀毕业生推荐信
2013/11/02 职场文书
公务员总结性个人自我评价
2013/12/05 职场文书
缴纳养老保险的证明
2014/01/10 职场文书
大学军训感言
2014/01/10 职场文书
优秀乡村医生事迹材料
2014/05/28 职场文书
检讨书范文1000字
2015/01/28 职场文书
三好学生个人总结
2015/02/15 职场文书
小王子读书笔记
2015/06/29 职场文书
简述python四种分词工具,盘点哪个更好用?
2021/04/13 Python