python定向爬取淘宝商品价格


Posted in Python onFebruary 27, 2018

python爬虫学习之定向爬取淘宝商品价格,供大家参考,具体内容如下

import requests
import re

def getHTMLText(url):
  try:
    r = requests.get(url, timeout=30)
    r.raise_for_status() #如果发送了一个失败请求(非200响应),#我们可以通过 Response.raise_for_status() 来抛出异常:
    r.encoding= r.apparent_encoding
    return r.text
  except:
    return ""

def parsePage(ilt,html):
  try:
    plt = re.findall(r'\"view_price\"\:\"[\d\.]*?\"',html) #正则表达式来匹配 "view_price":"\d\."类型的字符串
    tlt = re.findall(r'\"raw_title\"\:\".*?\"',html)
#正则表达式来匹配 "raw_title":".*?"类型的字符串,.*?是任意字符的最小匹配
    for i in range(len(plt)):
      price = eval(plt[i].split(':')[1])
      title = eval(tlt[i].split(':')[1])
      ilt.append([price,title])
  except:
    print ("")


def PrintGoodsList(ilt):
  tplt = "{:4}\t{:8}\t{:16}"
  print (tplt.format("序号","价格","商品名称"))
  count = 0
  for g in ilt:
    count = count + 1
    print (tplt.format(count,g[0],g[1]))
def main():
  goods = '书包'
  depth = 2
  start_url = 'https://s.taobao.com/search?q=' + goods
  infoList=[]
  for i in range(depth):
    try:
      url = start_url + '&s=' + str(44*i)
      html= getHTMLText(url)
      parsePage(infoList,html)
    except:
      continue

  PrintGoodsList(infoList)

main()

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python实现向QQ群成员自动发邮件的方法
Nov 19 Python
Python中给List添加元素的4种方法分享
Nov 28 Python
Python中的Classes和Metaclasses详解
Apr 02 Python
Python学习之Django的管理界面代码示例
Feb 10 Python
pandas中的DataFrame按指定顺序输出所有列的方法
Apr 10 Python
pandas or sql计算前后两行数据间的增值方法
Apr 20 Python
Python 通配符删除文件的实例
Apr 24 Python
利用python库在局域网内传输文件的方法
Jun 04 Python
pandas分别写入excel的不同sheet方法
Dec 11 Python
解决django后台管理界面添加中文内容乱码问题
Nov 15 Python
opencv3/C++图像像素操作详解
Dec 10 Python
关于tf.nn.dynamic_rnn返回值详解
Jan 20 Python
python抓取文件夹的所有文件
Feb 27 #Python
python数据分析数据标准化及离散化详解
Feb 26 #Python
批量将ppt转换为pdf的Python代码 只要27行!
Feb 26 #Python
python 3利用Dlib 19.7实现摄像头人脸检测特征点标定
Feb 26 #Python
python3利用Dlib19.7实现人脸68个特征点标定
Feb 26 #Python
python微信跳一跳系列之棋子定位颜色识别
Feb 26 #Python
python微信跳一跳系列之棋子定位像素遍历
Feb 26 #Python
You might like
一个典型的PHP分页实例代码分享
2011/07/28 PHP
深入解析PHP垃圾回收机制对内存泄露的处理
2013/06/14 PHP
CodeIgniter使用smtp服务发送html邮件的方法
2015/06/10 PHP
教你如何解密js/vbs/vbscript加密的编码异处理小结
2008/06/25 Javascript
基于javascript 闭包基础分享
2013/07/10 Javascript
教你如何在 Javascript 文件里使用 .Net MVC Razor 语法
2014/07/23 Javascript
jQuery CSS()方法改变现有的CSS样式表
2014/09/09 Javascript
Javascript this 关键字 详解
2014/10/22 Javascript
Vue.js 表单校验插件
2016/08/14 Javascript
第一次接触神奇的前端框架vue.js
2016/12/01 Javascript
vue 里面使用axios 和封装的示例代码
2017/09/01 Javascript
微信小程序模板和模块化用法实例分析
2017/11/28 Javascript
vue-router路由懒加载和权限控制详解
2017/12/13 Javascript
微信 jssdk 签名错误invalid signature的解决方法
2019/01/14 Javascript
Vue中Table组件Select的勾选和取消勾选事件详解
2019/03/19 Javascript
python中文乱码的解决方法
2013/11/04 Python
python正则表达式判断字符串是否是全部小写示例
2013/12/25 Python
Python 正则表达式(转义问题)
2014/12/15 Python
Python的Flask框架中使用Flask-Migrate扩展迁移数据库的教程
2016/06/14 Python
python使用Matplotlib绘制分段函数
2018/09/25 Python
python内置数据类型之列表操作
2018/11/12 Python
PyCharm配置mongo插件的方法
2018/11/30 Python
python sorted函数的小练习及解答
2019/09/18 Python
Python爬虫requests库多种用法实例
2020/05/28 Python
Python如何转换字符串大小写
2020/06/04 Python
用ldap作为django后端用户登录验证的实现
2020/12/07 Python
python绘图pyecharts+pandas的使用详解
2020/12/13 Python
医学检验专业个人求职信范文
2013/12/04 职场文书
酒店端午节促销方案
2014/02/18 职场文书
财务总监管理职责范文
2014/03/09 职场文书
经贸专业毕业生求职信范文
2014/05/01 职场文书
公司活动总结怎么写
2014/06/25 职场文书
社区服务活动小结
2014/07/08 职场文书
2015年保洁员工作总结
2015/05/04 职场文书
2015年小学师德师风建设工作总结
2015/10/23 职场文书
Vue接口封装的完整步骤记录
2021/05/14 Vue.js