python定向爬取淘宝商品价格


Posted in Python onFebruary 27, 2018

python爬虫学习之定向爬取淘宝商品价格,供大家参考,具体内容如下

import requests
import re

def getHTMLText(url):
  try:
    r = requests.get(url, timeout=30)
    r.raise_for_status() #如果发送了一个失败请求(非200响应),#我们可以通过 Response.raise_for_status() 来抛出异常:
    r.encoding= r.apparent_encoding
    return r.text
  except:
    return ""

def parsePage(ilt,html):
  try:
    plt = re.findall(r'\"view_price\"\:\"[\d\.]*?\"',html) #正则表达式来匹配 "view_price":"\d\."类型的字符串
    tlt = re.findall(r'\"raw_title\"\:\".*?\"',html)
#正则表达式来匹配 "raw_title":".*?"类型的字符串,.*?是任意字符的最小匹配
    for i in range(len(plt)):
      price = eval(plt[i].split(':')[1])
      title = eval(tlt[i].split(':')[1])
      ilt.append([price,title])
  except:
    print ("")


def PrintGoodsList(ilt):
  tplt = "{:4}\t{:8}\t{:16}"
  print (tplt.format("序号","价格","商品名称"))
  count = 0
  for g in ilt:
    count = count + 1
    print (tplt.format(count,g[0],g[1]))
def main():
  goods = '书包'
  depth = 2
  start_url = 'https://s.taobao.com/search?q=' + goods
  infoList=[]
  for i in range(depth):
    try:
      url = start_url + '&s=' + str(44*i)
      html= getHTMLText(url)
      parsePage(infoList,html)
    except:
      continue

  PrintGoodsList(infoList)

main()

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
常用python数据类型转换函数总结
Mar 11 Python
python lxml中etree的简单应用
May 10 Python
python实现雪花飘落效果实例讲解
Jun 18 Python
Python 使用matplotlib模块模拟掷骰子
Aug 08 Python
Python 使用 PyMysql、DBUtils 创建连接池提升性能
Aug 14 Python
python实现异常信息堆栈输出到日志文件
Dec 26 Python
python计算导数并绘图的实例
Feb 29 Python
解决Django no such table: django_session的问题
Apr 07 Python
记录一下scrapy中settings的一些配置小结
Sep 28 Python
pytorch Dataset,DataLoader产生自定义的训练数据案例
Mar 03 Python
详解Python函数print用法
Jun 18 Python
Python  序列化反序列化和异常处理的问题小结
Dec 24 Python
python抓取文件夹的所有文件
Feb 27 #Python
python数据分析数据标准化及离散化详解
Feb 26 #Python
批量将ppt转换为pdf的Python代码 只要27行!
Feb 26 #Python
python 3利用Dlib 19.7实现摄像头人脸检测特征点标定
Feb 26 #Python
python3利用Dlib19.7实现人脸68个特征点标定
Feb 26 #Python
python微信跳一跳系列之棋子定位颜色识别
Feb 26 #Python
python微信跳一跳系列之棋子定位像素遍历
Feb 26 #Python
You might like
在字符串中把网址改成超级链接
2006/10/09 PHP
IIS下PHP连接数据库提示mysql undefined function mysql_connect()
2010/06/04 PHP
PHP中call_user_func_array回调函数的用法示例
2016/11/26 PHP
Laravel5.* 打印出执行的sql语句的方法
2017/07/24 PHP
php提取微信账单的有效信息
2018/10/01 PHP
Prototype使用指南之dom.js
2007/01/10 Javascript
基于jquery的地址栏射击游戏代码
2011/03/10 Javascript
用队列模拟jquery的动画算法实例
2015/01/20 Javascript
JavaScript开发者必备的10个Sublime Text插件
2016/02/27 Javascript
jQuery实现三级菜单的代码
2016/05/09 Javascript
Javascript数组循环遍历之forEach详解
2016/11/07 Javascript
Node.js利用断言模块assert进行单元测试的方法
2017/09/28 Javascript
JavaScript时间戳与时间日期间相互转换
2017/12/11 Javascript
简单了解常用的JavaScript 库
2020/07/16 Javascript
python使用pil生成缩略图的方法
2015/03/26 Python
python字典DICT类型合并详解
2017/08/17 Python
python通过zabbix api获取主机
2018/09/17 Python
python 使用poster模块进行http方式的文件传输到服务器的方法
2019/01/15 Python
详解python实现交叉验证法与留出法
2019/07/11 Python
python3中的eval和exec的区别与联系
2019/10/10 Python
Windows下Anaconda和PyCharm的安装与使用详解
2020/04/23 Python
基于Python第三方插件实现西游记章节标注汉语拼音的方法
2020/05/22 Python
使用keras实现孪生网络中的权值共享教程
2020/06/11 Python
python实现二分查找算法
2020/09/18 Python
狗狗玩具、零食和咀嚼物的月度送货服务:Super Chewer
2018/08/22 全球购物
C&A巴西网上商店:时尚、衣服、手机和鞋子
2020/06/07 全球购物
锐步香港官方网上商店:Reebok香港
2020/11/05 全球购物
如果有两个类A,B,怎么样才能使A在发生一个事件的时候通知B
2016/03/12 面试题
建筑工程实习自我鉴定
2013/09/19 职场文书
公司财务会计主管应聘求职信
2014/09/26 职场文书
社区文明创建工作总结2015
2015/04/21 职场文书
大学毕业论文致谢词
2015/05/14 职场文书
2019最新公司租房合同(例文)
2019/07/18 职场文书
关于CSS浮动与取消浮动的问题
2021/06/28 HTML / CSS
Nginx stream 配置代理(Nginx TCP/UDP 负载均衡)
2021/11/17 Servers
Nginx如何获取自定义请求header头和URL参数详解
2022/07/23 Servers