python定向爬取淘宝商品价格


Posted in Python onFebruary 27, 2018

python爬虫学习之定向爬取淘宝商品价格,供大家参考,具体内容如下

import requests
import re

def getHTMLText(url):
  try:
    r = requests.get(url, timeout=30)
    r.raise_for_status() #如果发送了一个失败请求(非200响应),#我们可以通过 Response.raise_for_status() 来抛出异常:
    r.encoding= r.apparent_encoding
    return r.text
  except:
    return ""

def parsePage(ilt,html):
  try:
    plt = re.findall(r'\"view_price\"\:\"[\d\.]*?\"',html) #正则表达式来匹配 "view_price":"\d\."类型的字符串
    tlt = re.findall(r'\"raw_title\"\:\".*?\"',html)
#正则表达式来匹配 "raw_title":".*?"类型的字符串,.*?是任意字符的最小匹配
    for i in range(len(plt)):
      price = eval(plt[i].split(':')[1])
      title = eval(tlt[i].split(':')[1])
      ilt.append([price,title])
  except:
    print ("")


def PrintGoodsList(ilt):
  tplt = "{:4}\t{:8}\t{:16}"
  print (tplt.format("序号","价格","商品名称"))
  count = 0
  for g in ilt:
    count = count + 1
    print (tplt.format(count,g[0],g[1]))
def main():
  goods = '书包'
  depth = 2
  start_url = 'https://s.taobao.com/search?q=' + goods
  infoList=[]
  for i in range(depth):
    try:
      url = start_url + '&s=' + str(44*i)
      html= getHTMLText(url)
      parsePage(infoList,html)
    except:
      continue

  PrintGoodsList(infoList)

main()

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python网络编程之数据传输UDP实例分析
May 20 Python
Python文件读取的3种方法及路径转义
Jun 21 Python
初探TensorFLow从文件读取图片的四种方式
Feb 06 Python
python 反向输出字符串的方法
Jul 16 Python
python获取地震信息 微信实时推送
Jun 18 Python
Flask框架模板渲染操作简单示例
Jul 31 Python
如何使用python进行pdf文件分割
Nov 11 Python
opencv3/Python 稠密光流calcOpticalFlowFarneback详解
Dec 11 Python
Python递归及尾递归优化操作实例分析
Feb 01 Python
windows下的pycharm安装及其设置中文菜单
Apr 23 Python
scrapy中如何设置应用cookies的方法(3种)
Sep 22 Python
使用qt quick-ListView仿微信好友列表和聊天列表的示例代码
Jun 13 Python
python抓取文件夹的所有文件
Feb 27 #Python
python数据分析数据标准化及离散化详解
Feb 26 #Python
批量将ppt转换为pdf的Python代码 只要27行!
Feb 26 #Python
python 3利用Dlib 19.7实现摄像头人脸检测特征点标定
Feb 26 #Python
python3利用Dlib19.7实现人脸68个特征点标定
Feb 26 #Python
python微信跳一跳系列之棋子定位颜色识别
Feb 26 #Python
python微信跳一跳系列之棋子定位像素遍历
Feb 26 #Python
You might like
详细介绍:Apache+PHP+MySQL配置攻略
2006/09/05 PHP
php中定义网站根目录的常用方法
2010/08/08 PHP
php懒人函数 自动添加数据
2011/06/28 PHP
深入探讨:Nginx 502 Bad Gateway错误的解决方法
2013/06/03 PHP
详解php命令注入攻击
2019/04/06 PHP
PHP7新特性
2021/03/09 PHP
JavaScript时间转换处理函数
2015/04/14 Javascript
微信小程序loading组件显示载入动画用法示例【附源码下载】
2017/12/09 Javascript
详解vue-cli之webpack3构建全面提速优化
2017/12/25 Javascript
Vue中CSS动画原理的实现
2019/02/13 Javascript
对layui中table组件工具栏的使用详解
2019/09/19 Javascript
javascript实现蒙版与禁止页面滚动
2020/01/11 Javascript
vue样式穿透 ::v-deep的具体使用
2020/06/04 Javascript
Node.js 中判断一个文件是否存在
2020/08/24 Javascript
vue 路由meta 设置导航隐藏与显示功能的示例代码
2020/09/04 Javascript
超详细小程序定位地图模块全系列开发教学
2020/11/24 Javascript
[43:47]DOTA2上海特级锦标赛主赛事日 - 4 败者组第四轮#2 MVP.Phx VS Fnatic第一局
2016/03/05 DOTA
python实现在目录中查找指定文件的方法
2014/11/11 Python
[原创]Python入门教程5. 字典基本操作【定义、运算、常用函数】
2018/11/01 Python
通过python改变图片特定区域的颜色详解
2019/07/15 Python
numpy ndarray 按条件筛选数组,关联筛选的例子
2019/11/26 Python
Python使用matplotlib绘制Logistic曲线操作示例
2019/11/28 Python
解决Python在导入文件时的FileNotFoundError问题
2020/04/10 Python
解决Python3.7.0 SSL低版本导致Pip无法使用问题
2020/09/03 Python
Python 高效编程技巧分享
2020/09/10 Python
python 绘制国旗的示例
2020/09/27 Python
浅谈移动端网页图片预加载方案
2018/11/05 HTML / CSS
以设计师精品品质提供快速时尚:PopJulia
2018/01/09 全球购物
小饰品店的创业计划书范文
2013/12/28 职场文书
幼儿园安全检查制度
2014/01/30 职场文书
社会学专业求职信
2014/02/24 职场文书
应急管理培训方案
2014/06/12 职场文书
超市七夕促销活动方案
2014/08/28 职场文书
检讨书范文
2015/01/27 职场文书
交通肇事罪辩护词
2015/05/21 职场文书
《鲁滨逊漂流记》之六读后感(4篇)
2019/09/29 职场文书