python实现二维码扫码自动登录淘宝


Posted in Python onDecember 27, 2016

一个小项目自动登录淘宝联盟抓取数据,由于之前在Github上看过类似用Python写的代码因此选择用Python来写,第一次用Python正式写程序还是被其“简单”所震撼,当然用的时候还是对其(2.7版)编码、迁移环境等问题所困扰,还好后来都解决了。

言归正传,抓取淘宝联盟的数据首先要解决的就是登录的问题,之前一般会碰到验证码的困扰,现在支持二维码扫码登录反而简单了,以下是登录的Python代码,主要是获取二维码打印,然后不断的检查扫码状态,如果过期了重新请求二维码(主要看逻辑,由于有些通用方法做了封装所以不保证能直接执行)

def getQRCode(enableCmdQR):
  payload = {'_ksTS': str(time.time()), 'from': 'alimama'}
  qrCodeObj = utils.fetchAPI('https://qrlogin.taobao.com/qrcodelogin/generateQRCode4Login.do', payload,
                "json", None, True, True)
 
  print(qrCodeObj)
  utils.printQRCode('http:' + qrCodeObj['url'], enableCmdQR)
  lgToken = qrCodeObj['lgToken']
  return lgToken
 
 
def login(enableCmdQR=False):
  lgToken = getQRCode(enableCmdQR)
  code = 0
  successLoginURL = ""
  while code != 10006:
    payload = {'lgToken': lgToken,
          'defaulturl': 'http%3A%2F%2Flogin.taobao.com%2Fmember%2Ftaobaoke%2Flogin.htm%3Fis_login%3D1&_ksTS=' + str(
            time.time())}
 
    rObj = utils.fetchAPI('https://qrlogin.taobao.com/qrcodelogin/qrcodeLoginCheck.do', payload, "json", True,
               False)
    code = int(rObj['code'])
    if 10000 == code:
      # print("请扫描二维码登录")
      continue
    elif 10001 == code:
      print("已扫描二维码,请在确认登录")
    elif 10004 == code:
      print("已过期请重新扫描")
      login()
    elif 10006 == code:
      successLoginURL = rObj["url"]
      print("登录成功,正在跳转")
    else:
      print("未知错误,退出执行")
      sys.exit(0)
 
    time.sleep(5)
 
  print "登录成功跳转:" + successLoginURL
  r = utils.fetchAPI(successLoginURL, None, "raw", True, False, True)
  utils.fetchAPI(r.headers['Location'], None, "raw", True, True, False)

解决登录问题接下去就要解决保存状态的问题,Python的Requests库非常强大,如果简单的话可以直接使用request.session来进行会话操作,但由于项目中的很多操作是异步的因此需要解决cookie的存储和读取,使用pickel进行对像的序列化和反序列化。其中保存cookie默认用增量的方式进行更新

def save_cookies(cookies, overWrite=False):
  try:
    currentCookie = requests.utils.dict_from_cookiejar(cookies)
    if len(currentCookie) < 1:
      return
    oldCookie = requests.utils.dict_from_cookiejar(load_cookies())
    with open(config.COOKIE_FILE, 'w') as f:
      if not overWrite:
        cookieDict = dict(oldCookie, **currentCookie)
      else:
        cookieDict = requests.utils.dict_from_cookiejar(cookies)
      pickle.dump(cookieDict, f)
      print 'Saved cookie'
      print cookieDict
      f.close()
  except:
    print 'Save cookies failed', sys.exc_info()[0]
    sys.exit(99)


def load_cookies():
  try:
    with open(config.COOKIE_FILE, 'r') as f:
      cookies = requests.utils.cookiejar_from_dict(pickle.load(f))
      f.close()
  except:
    cookies = []
  return cookies

封装好之后,在requests.Session请求时加载cookie并保存cookie

s = requests.Session()
# 统一请求API
def fetchAPI(url, params=None, resultFormat="text", isNeedCookie=True, allowRedirects=True, saveCookie=False,
       method='GET'):
  try:
    cookies = load_cookies()
    if 'POST' == method:
      response = s.post(url, data=params, headers=config.Headers, cookies=cookies)
    else:
      response = s.get(url, params=params, headers=config.Headers, cookies=cookies,
               allow_redirects=allowRedirects)

    if "json" == resultFormat:
      result = response.json()
    elif "raw" == resultFormat:
      result = response
    else:
      result = response.text

    # if saveCookie:
    # print 'save cookie:' + str(response.cookies)
    save_cookies(response.cookies)

    return result

  except Exception, e:
    print e
    return False

这两步做好之后基本后续的请求就直接使用统一的API请求方法即可,效果也非常不错,运行效果截图:

python实现二维码扫码自动登录淘宝

当然还有一个问题未解决:如何在session过期之后如何自动重新申请(不确定淘定是否支持),由于淘宝是用统一登录而且是独立的服务因此通过浏览器自动刷新或者请求过程中不断去更新cookie都没有获得服务器方更新的票据,不知道这一块大家有没有可以提供的思路。

Python 相关文章推荐
Python中解析JSON并同时进行自定义编码处理实例
Feb 08 Python
Python Socket传输文件示例
Jan 16 Python
Python中%r和%s的详解及区别
Mar 16 Python
浅谈Python中的私有变量
Feb 28 Python
pandas 使用apply同时处理两列数据的方法
Apr 20 Python
新手如何发布Python项目开源包过程详解
Jul 11 Python
scikit-learn线性回归,多元回归,多项式回归的实现
Aug 29 Python
Pycharm中import torch报错的快速解决方法
Mar 05 Python
TensorFlow实现批量归一化操作的示例
Apr 22 Python
python 列表推导和生成器表达式的使用
Feb 01 Python
python爬虫智能翻页批量下载文件的实例详解
Feb 02 Python
Python一些基本的图像操作和处理总结
Jun 23 Python
使用Python的Scrapy框架十分钟爬取美女图
Dec 26 #Python
Python中如何获取类属性的列表
Dec 26 #Python
Python中强大的命令行库click入门教程
Dec 26 #Python
Python快速从注释生成文档的方法
Dec 26 #Python
浅谈Python类的__getitem__和__setitem__特殊方法
Dec 25 #Python
解决pyqt中ui编译成窗体.py中文乱码的问题
Dec 23 #Python
详解python进行mp3格式判断
Dec 23 #Python
You might like
用来解析.htgroup文件的PHP类
2012/09/05 PHP
div li的多行多列 无刷新分页示例代码
2013/10/16 PHP
PHP CURL获取返回值的方法
2014/05/04 PHP
PHP合并静态文件详解
2014/11/14 PHP
Thinkphp无限级分类代码
2015/11/11 PHP
Lumen timezone 时区设置方法(慢了8个小时)
2018/01/20 PHP
PHP中有关长整数的一些操作教程
2019/09/11 PHP
laravel框架中视图的基本使用方法分析
2019/11/23 PHP
php计数排序算法的实现代码(附四个实例代码)
2020/03/31 PHP
javascript编程起步(第二课)
2007/02/27 Javascript
用jQuery扩展自写的 UI导航
2010/01/13 Javascript
jQuery库与其他JS库冲突的解决办法
2010/02/07 Javascript
有趣的javascript数组定义方法
2010/09/10 Javascript
javascript游戏开发之《三国志曹操传》零部件开发(四)用地图块拼成大地图
2013/01/23 Javascript
用js写了一个类似php的print_r输出换行功能
2013/02/18 Javascript
select标记美化--JS式插件、后期加载
2013/04/01 Javascript
自己动手手写jQuery插件总结
2015/01/20 Javascript
javascript实现检验的各种规则
2015/07/31 Javascript
JavaScript在form表单中使用button按钮实现submit提交方法
2017/01/23 Javascript
JS沙箱模式实例分析
2017/09/04 Javascript
jQuery中extend函数简单用法示例
2017/10/11 jQuery
vue.js实现点击后动态添加class及删除同级class的实现代码
2018/04/04 Javascript
解决js中的setInterval清空定时器不管用问题
2020/11/17 Javascript
Vue如何实现变量表达式选择器
2021/02/18 Vue.js
Python属性和内建属性实例解析
2020/01/14 Python
Django模板标签{% for %}循环,获取制定条数据实例
2020/05/14 Python
Python爬虫+tkinter界面实现历史天气查询的思路详解
2021/02/22 Python
使用CSS3 制作一个material-design 风格登录界面实例
2016/12/12 HTML / CSS
John Hardy官方网站:手工设计首饰的奢侈品牌
2017/07/05 全球购物
荷兰家电购物网站:Expert.nl
2020/01/18 全球购物
计算机应用专业推荐信
2013/11/13 职场文书
大学毕业生求职自荐信
2014/02/20 职场文书
岳麓书院导游词
2015/02/03 职场文书
2016高考感言
2015/08/01 职场文书
Pytorch中TensorBoard及torchsummary的使用详解
2021/05/12 Python
vue组件冲突之引用另一个组件出现组件不显示的问题
2022/04/13 Vue.js