python定向爬取淘宝商品价格


Posted in Python onFebruary 27, 2018

python爬虫学习之定向爬取淘宝商品价格,供大家参考,具体内容如下

import requests
import re

def getHTMLText(url):
  try:
    r = requests.get(url, timeout=30)
    r.raise_for_status() #如果发送了一个失败请求(非200响应),#我们可以通过 Response.raise_for_status() 来抛出异常:
    r.encoding= r.apparent_encoding
    return r.text
  except:
    return ""

def parsePage(ilt,html):
  try:
    plt = re.findall(r'\"view_price\"\:\"[\d\.]*?\"',html) #正则表达式来匹配 "view_price":"\d\."类型的字符串
    tlt = re.findall(r'\"raw_title\"\:\".*?\"',html)
#正则表达式来匹配 "raw_title":".*?"类型的字符串,.*?是任意字符的最小匹配
    for i in range(len(plt)):
      price = eval(plt[i].split(':')[1])
      title = eval(tlt[i].split(':')[1])
      ilt.append([price,title])
  except:
    print ("")


def PrintGoodsList(ilt):
  tplt = "{:4}\t{:8}\t{:16}"
  print (tplt.format("序号","价格","商品名称"))
  count = 0
  for g in ilt:
    count = count + 1
    print (tplt.format(count,g[0],g[1]))
def main():
  goods = '书包'
  depth = 2
  start_url = 'https://s.taobao.com/search?q=' + goods
  infoList=[]
  for i in range(depth):
    try:
      url = start_url + '&s=' + str(44*i)
      html= getHTMLText(url)
      parsePage(infoList,html)
    except:
      continue

  PrintGoodsList(infoList)

main()

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python查询阿里巴巴关键字排名的方法
Jul 08 Python
Python删除Java源文件中全部注释的实现方法
Aug 30 Python
python使用邻接矩阵构造图代码示例
Nov 10 Python
wxPython的安装图文教程(Windows)
Dec 28 Python
python实现回旋矩阵方式(旋转矩阵)
Dec 04 Python
pygame实现飞机大战
Mar 11 Python
解决python Jupyter不能导入外部包问题
Apr 15 Python
python编写一个会算账的脚本的示例代码
Jun 02 Python
Keras在训练期间可视化训练误差和测试误差实例
Jun 16 Python
python连接mysql有哪些方法
Jun 24 Python
如何在python中处理配置文件代码实例
Sep 27 Python
Python数组变形的几种实现方法
May 30 Python
python抓取文件夹的所有文件
Feb 27 #Python
python数据分析数据标准化及离散化详解
Feb 26 #Python
批量将ppt转换为pdf的Python代码 只要27行!
Feb 26 #Python
python 3利用Dlib 19.7实现摄像头人脸检测特征点标定
Feb 26 #Python
python3利用Dlib19.7实现人脸68个特征点标定
Feb 26 #Python
python微信跳一跳系列之棋子定位颜色识别
Feb 26 #Python
python微信跳一跳系列之棋子定位像素遍历
Feb 26 #Python
You might like
人工智能开始玩《星际争霸2》 你的操作跟得上吗?
2017/08/11 星际争霸
使用php来实现网络服务
2009/09/15 PHP
Apache 配置详解(最好的APACHE配置教程)
2010/07/04 PHP
ajax 的post方法实例(带循环)
2011/07/04 PHP
PHP实现过滤各种HTML标签
2015/05/17 PHP
golang与php实现计算两个经纬度之间距离的方法
2016/07/22 PHP
基于jQuery捕获超链接事件进行局部刷新代码
2012/05/10 Javascript
JS判断不同分辨率调用不同的CSS样式文件实现思路及测试代码
2013/01/23 Javascript
jQuery实现可关闭固定于底(顶)部的工具条菜单效果
2015/11/06 Javascript
javascript中FOREACH数组方法使用示例
2016/03/01 Javascript
AngularJs IE Compatibility 兼容老版本IE
2016/09/01 Javascript
jquery dataview数据视图插件使用方法
2016/12/23 Javascript
微信小程序 action-sheet 反馈上拉菜单简单实例
2017/05/11 Javascript
如何用webpack4带你实现一个vue的打包的项目
2018/06/20 Javascript
js逆向解密之网络爬虫
2019/05/30 Javascript
你或许不知道的一些npm实用技巧
2019/07/04 Javascript
Vue实现页面添加水印功能
2019/11/09 Javascript
在Vue中使用HOC模式的实现
2020/08/23 Javascript
js实现简单的轮播图效果
2020/12/13 Javascript
python计算书页码的统计数字问题实例
2014/09/26 Python
在NumPy中创建空数组/矩阵的方法
2018/06/15 Python
python爬虫开发之selenium模块详细使用方法与实例全解
2020/03/09 Python
Python 分布式缓存之Reids数据类型操作详解
2020/06/24 Python
eBay瑞士购物网站:eBay.ch
2018/12/24 全球购物
几个人围成一圈的问题
2013/09/26 面试题
物流仓储计划书
2014/01/10 职场文书
小学生作文评语大全
2014/04/21 职场文书
临床专业自荐信
2014/06/22 职场文书
群众路线个人剖析材料
2014/10/07 职场文书
幼儿园中班教师个人工作总结
2015/02/06 职场文书
谢师宴家长答谢词
2015/09/30 职场文书
严以律己学习心得体会
2016/01/13 职场文书
初中生物教学反思
2016/02/20 职场文书
Mysql中where与on的区别及何时使用详析
2021/08/04 MySQL
使用 Apache Dubbo 实现远程通信(微服务架构)
2022/02/12 Servers
十大好看的穿越动漫排名:《瑞克和莫蒂》第一,国漫《有药》在榜
2022/03/18 日漫