python定向爬取淘宝商品价格


Posted in Python onFebruary 27, 2018

python爬虫学习之定向爬取淘宝商品价格,供大家参考,具体内容如下

import requests
import re

def getHTMLText(url):
  try:
    r = requests.get(url, timeout=30)
    r.raise_for_status() #如果发送了一个失败请求(非200响应),#我们可以通过 Response.raise_for_status() 来抛出异常:
    r.encoding= r.apparent_encoding
    return r.text
  except:
    return ""

def parsePage(ilt,html):
  try:
    plt = re.findall(r'\"view_price\"\:\"[\d\.]*?\"',html) #正则表达式来匹配 "view_price":"\d\."类型的字符串
    tlt = re.findall(r'\"raw_title\"\:\".*?\"',html)
#正则表达式来匹配 "raw_title":".*?"类型的字符串,.*?是任意字符的最小匹配
    for i in range(len(plt)):
      price = eval(plt[i].split(':')[1])
      title = eval(tlt[i].split(':')[1])
      ilt.append([price,title])
  except:
    print ("")


def PrintGoodsList(ilt):
  tplt = "{:4}\t{:8}\t{:16}"
  print (tplt.format("序号","价格","商品名称"))
  count = 0
  for g in ilt:
    count = count + 1
    print (tplt.format(count,g[0],g[1]))
def main():
  goods = '书包'
  depth = 2
  start_url = 'https://s.taobao.com/search?q=' + goods
  infoList=[]
  for i in range(depth):
    try:
      url = start_url + '&s=' + str(44*i)
      html= getHTMLText(url)
      parsePage(infoList,html)
    except:
      continue

  PrintGoodsList(infoList)

main()

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python 匹配任意字符(包括换行符)的正则表达式写法
Oct 29 Python
在Python中使用M2Crypto模块实现AES加密的教程
Apr 08 Python
Python找出list中最常出现元素的方法
Jun 14 Python
Python实现购物程序思路及代码
Jul 24 Python
python使用SMTP发送qq或sina邮件
Oct 21 Python
pip matplotlib报错equired packages can not be built解决
Jan 06 Python
通过Pandas读取大文件的实例
Jun 07 Python
python中强大的format函数实例详解
Dec 05 Python
零基础学python应该从哪里入手
Aug 11 Python
利用python进行文件操作
Dec 04 Python
python实现简单区块链结构
Apr 25 Python
Opencv中cv2.floodFill算法的使用
Jun 18 Python
python抓取文件夹的所有文件
Feb 27 #Python
python数据分析数据标准化及离散化详解
Feb 26 #Python
批量将ppt转换为pdf的Python代码 只要27行!
Feb 26 #Python
python 3利用Dlib 19.7实现摄像头人脸检测特征点标定
Feb 26 #Python
python3利用Dlib19.7实现人脸68个特征点标定
Feb 26 #Python
python微信跳一跳系列之棋子定位颜色识别
Feb 26 #Python
python微信跳一跳系列之棋子定位像素遍历
Feb 26 #Python
You might like
浅谈PHP array_search 和 in_array 函数效率问题
2019/10/15 PHP
iframe 父窗口和子窗口相互的调用方法集锦
2010/12/15 Javascript
javascript真的不难-回顾一下基础知识
2013/01/15 Javascript
JavaScript检测并限制复选框选中个数的方法
2015/08/12 Javascript
超精准的javascript验证身份证号的具体实现方法
2015/11/18 Javascript
JS组件Bootstrap Table表格多行拖拽效果实现代码
2015/12/08 Javascript
第二次聊一聊JS require.js模块化工具的基础知识
2016/04/17 Javascript
jQuery1.9+中删除了live以后的替代方法
2016/06/17 Javascript
分享jQuery封装好的一些常用操作
2016/07/28 Javascript
jquery表单验证插件validation使用方法详解
2017/01/20 Javascript
Vue 2.X的状态管理vuex记录详解
2017/03/23 Javascript
JS+HTML5实现上传图片预览效果完整实例【测试可用】
2017/04/20 Javascript
vue.js 左侧二级菜单显示与隐藏切换的实例代码
2017/05/23 Javascript
强大的JavaScript响应式图表Chartist.js的使用
2017/09/13 Javascript
Router解决跨模块下的页面跳转示例
2018/01/11 Javascript
layui从数据库中获取复选框的值并默认选中方法
2018/08/15 Javascript
JS错误处理与调试操作实例分析
2020/04/13 Javascript
Python环境下安装使用异步任务队列包Celery的基础教程
2016/05/07 Python
关于Python中异常(Exception)的汇总
2017/01/18 Python
Python使用文件锁实现进程间同步功能【基于fcntl模块】
2017/10/16 Python
python解决字符串倒序输出的问题
2018/06/25 Python
python文件操作之批量修改文件后缀名的方法
2018/08/10 Python
Python简单处理坐标排序问题示例
2019/07/11 Python
python实现邮件发送功能
2019/08/10 Python
浅谈django 重载str 方法
2020/05/19 Python
Selenium及python实现滚动操作多种方法
2020/07/21 Python
PyCharm设置注释字体颜色以及是否倾斜的操作
2020/09/16 Python
Python字典取键、值对的方法步骤
2020/09/30 Python
Python爬虫之App爬虫视频下载的实现
2020/12/08 Python
html5手机键盘弹出收起的处理
2020/01/20 HTML / CSS
编辑个人求职信范文
2013/09/21 职场文书
优秀学生干部个人的自我评价
2013/10/04 职场文书
员工工作及收入证明
2014/10/28 职场文书
2015年出纳个人工作总结
2015/04/02 职场文书
如何用PHP实现多线程编程
2021/05/26 PHP
十大最强火系宝可梦,喷火龙上榜,第一名有双火属性
2022/03/18 日漫