python定向爬取淘宝商品价格


Posted in Python onFebruary 27, 2018

python爬虫学习之定向爬取淘宝商品价格,供大家参考,具体内容如下

import requests
import re

def getHTMLText(url):
  try:
    r = requests.get(url, timeout=30)
    r.raise_for_status() #如果发送了一个失败请求(非200响应),#我们可以通过 Response.raise_for_status() 来抛出异常:
    r.encoding= r.apparent_encoding
    return r.text
  except:
    return ""

def parsePage(ilt,html):
  try:
    plt = re.findall(r'\"view_price\"\:\"[\d\.]*?\"',html) #正则表达式来匹配 "view_price":"\d\."类型的字符串
    tlt = re.findall(r'\"raw_title\"\:\".*?\"',html)
#正则表达式来匹配 "raw_title":".*?"类型的字符串,.*?是任意字符的最小匹配
    for i in range(len(plt)):
      price = eval(plt[i].split(':')[1])
      title = eval(tlt[i].split(':')[1])
      ilt.append([price,title])
  except:
    print ("")


def PrintGoodsList(ilt):
  tplt = "{:4}\t{:8}\t{:16}"
  print (tplt.format("序号","价格","商品名称"))
  count = 0
  for g in ilt:
    count = count + 1
    print (tplt.format(count,g[0],g[1]))
def main():
  goods = '书包'
  depth = 2
  start_url = 'https://s.taobao.com/search?q=' + goods
  infoList=[]
  for i in range(depth):
    try:
      url = start_url + '&s=' + str(44*i)
      html= getHTMLText(url)
      parsePage(infoList,html)
    except:
      continue

  PrintGoodsList(infoList)

main()

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python实现倒计时的示例
Feb 14 Python
Python使用Srapy框架爬虫模拟登陆并抓取知乎内容
Jul 02 Python
Python实现excel转sqlite的方法
Jul 17 Python
python如何在循环引用中管理内存
Mar 20 Python
Tensorflow中使用tfrecord方式读取数据的方法
Jun 19 Python
Python中使用Counter进行字典创建以及key数量统计的方法
Jul 06 Python
Python中logging.NullHandler 的使用教程
Nov 29 Python
python实现在遍历列表时,直接对dict元素增加字段的方法
Jan 15 Python
python的pytest框架之命令行参数详解(下)
Jun 27 Python
解决Python中回文数和质数的问题
Nov 24 Python
Python爬虫定时计划任务的几种常见方法(推荐)
Jan 15 Python
python通过opencv调用摄像头操作实例分析
Jun 07 Python
python抓取文件夹的所有文件
Feb 27 #Python
python数据分析数据标准化及离散化详解
Feb 26 #Python
批量将ppt转换为pdf的Python代码 只要27行!
Feb 26 #Python
python 3利用Dlib 19.7实现摄像头人脸检测特征点标定
Feb 26 #Python
python3利用Dlib19.7实现人脸68个特征点标定
Feb 26 #Python
python微信跳一跳系列之棋子定位颜色识别
Feb 26 #Python
python微信跳一跳系列之棋子定位像素遍历
Feb 26 #Python
You might like
php获取远程文件大小
2015/10/20 PHP
微信网页授权(OAuth2.0) PHP 源码简单实现
2016/08/29 PHP
laravel实现前后台路由分离的方法
2019/10/13 PHP
学习YUI.Ext 第四天--对话框Dialog的使用
2007/03/10 Javascript
基于jQuery的输入框无值自动显示指定数据的实现代码
2011/01/24 Javascript
firefox下jquery iframe刷新页面提示会导致重复之前动作
2012/12/17 Javascript
基于JQuery 滑动与动画的说明介绍
2013/04/18 Javascript
javascript中对Attr(dom中属性)的操作示例讲解
2013/12/02 Javascript
基于jQuery实现复选框是否选中进行答题提示
2015/12/10 Javascript
全面解析jQuery $(document).ready()和JavaScript onload事件
2016/06/08 Javascript
关于AngularJs数据的本地存储详解
2017/01/20 Javascript
详解javascript立即执行函数表达式IIFE
2017/02/13 Javascript
vue.js利用Object.defineProperty实现双向绑定
2017/03/09 Javascript
protractor的安装与基本使用教程
2017/07/07 Javascript
简单谈谈js的数据类型
2017/09/25 Javascript
Vue入门之数据绑定(小结)
2018/01/08 Javascript
vue 双向数据绑定的实现学习之监听器的实现方法
2018/11/30 Javascript
JS删除String里某个字符的方法
2021/01/06 Javascript
Python中优化NumPy包使用性能的教程
2015/04/23 Python
总结网络IO模型与select模型的Python实例讲解
2016/06/27 Python
Python虚拟环境的原理及使用详解
2019/07/02 Python
python requests更换代理适用于IP频率限制的方法
2019/08/21 Python
pip 安装库比较慢的解决方法(国内镜像)
2019/10/06 Python
python多进程(加入进程池)操作常见案例
2019/10/21 Python
Hotels.com南非:酒店预订
2017/11/02 全球购物
澳大利亚女装精品店:Alannah Hill
2020/07/29 全球购物
Python里面如何拷贝一个对象
2014/02/17 面试题
大学毕业通用个人的求职信
2013/12/08 职场文书
小学数学教学反思
2014/02/02 职场文书
教师自我反思材料
2014/02/14 职场文书
优秀德育工作者事迹材料
2014/05/07 职场文书
市场营销专业求职信
2014/06/17 职场文书
2015年社区工作总结
2015/04/08 职场文书
2015年酒店销售部工作总结
2015/07/24 职场文书
工商局调档介绍信
2015/10/22 职场文书
PHP实现两种排课方式
2021/06/26 PHP