爬虫代理的cookie如何生成运行


Posted in Python onSeptember 22, 2020

HTTP是用于互联网传输数据信息到本地的一种传送协议

我们在浏览器中输入输入关键词,会返回页面内容。这就是我们用浏览器向网站所在的服务器发送了一个请求,网站的服务器接收到这个请求后进行解析,然后把网页内容呈现出来。

有时候服务器网站会检测IP在一个时间段内的请求次数,如果过于频繁,就会拒绝服务,简称为封IP。

HTTP代理就是用别人的IP进行访问,进行IP伪装。

除非是访问网站或APP专用数据api接口,正常的HTTP请求都需要进行ua(User-Agent)优化,因为ua是浏览器标识,如果http请求没有ua,或ua太少,都会被网站运维统计异常的,ua越丰富分布就越真实。cookie最好是登陆获取的,一般访客的cookie,对方限制会比较严格,可以控制一个地区新访客的访问频率。另外反爬统计的js也要分析下,是不是做了机器人判断,有没有做窗口分辨率判断等。

生成cookie:

import os
import time
import zipfile

from selenium import webdriver
from selenium.common.exceptions import TimeoutException
from selenium.webdriver.common.by import By
from selenium.webdriver.support import expected_conditions as EC
from selenium.webdriver.support.ui import WebDriverWait


class GenCookies(object):
  USER_AGENT = open('useragents.txt').readlines()
  # www.16yun.cn 代理配置
  PROXY_HOST = 't.16yun.cn' # proxy or host
  PROXY_PORT = 31111 # port
  PROXY_USER = 'USERNAME' # username
  PROXY_PASS = 'PASSWORD' # password
def open(self):
    """
    打开网页输入用户名密码并点击
    :return: None
    """
    self.browser.delete_all_cookies()
    self.browser.get(self.url)
    username = self.wait.until(EC.presence_of_element_located((By.ID, 'loginName')))
    password = self.wait.until(EC.presence_of_element_located((By.ID, 'loginPassword')))
    submit = self.wait.until(EC.element_to_be_clickable((By.ID, 'loginAction')))
    username.send_keys(self.username)
    password.send_keys(self.password)
    time.sleep(1)
    submit.click()

  def password_error(self):
    """
    判断是否密码错误
    :return:
    """
    try:
      return WebDriverWait(self.browser, 5).until(
        EC.text_to_be_present_in_element((By.ID, 'errorMsg'), '用户名或密码错误'))
    except TimeoutException:
      return False

  def get_cookies(self):
    """
    获取Cookies
    :return:
    """
    return self.browser.get_cookies()

运行cookie:

API接口开始运行
* Running on http://0.0.0.0:5000/ (Press CTRL+C to quit)
Cookies生成进程开始运行
Cookies检测进程开始运行
正在生成Cookies 账号 180000000 密码 16yun
正在测试Cookies 用户名 180000000
Cookies有效 180000000

如果HTTP请求成功,HTTP的状态码会返回200且返回数据。当然其他HTTP其他状态码也有,403表示禁止访问,504服务器内部出错等等。

以上就是爬虫代理的cookie如何生成运行的详细内容,更多关于爬虫代理 cookie的资料请关注三水点靠木其它相关文章!

Python 相关文章推荐
python每隔N秒运行指定函数的方法
Mar 16 Python
Django中实现点击图片链接强制直接下载的方法
May 14 Python
Python使用Paramiko模块编写脚本进行远程服务器操作
May 05 Python
Python用模块pytz来转换时区
Aug 19 Python
浅谈python可视化包Bokeh
Feb 07 Python
便捷提取python导入包的属性方法
Oct 15 Python
Django之无名分组和有名分组的实现
Apr 16 Python
Python实现把类当做字典来访问
Dec 16 Python
TensorFlow梯度求解tf.gradients实例
Feb 04 Python
Django ORM实现按天获取数据去重求和例子
May 18 Python
python 爬取腾讯视频评论的实现步骤
Feb 18 Python
Python中的min及返回最小值索引的操作
May 10 Python
python 如何将office文件转换为PDF
Sep 22 #Python
Python制作一个仿QQ办公版的图形登录界面
Sep 22 #Python
Python使用for生成列表实现过程解析
Sep 22 #Python
python实现发送带附件的邮件代码分享
Sep 22 #Python
使用Python绘制台风轨迹图的示例代码
Sep 21 #Python
利用python绘制中国地图(含省界、河流等)
Sep 21 #Python
python利用google翻译方法实例(翻译字幕文件)
Sep 21 #Python
You might like
对text数据类型不支持代码页转换 从: 1252 到: 936
2011/04/23 PHP
如何用PHP实现插入排序?
2013/04/10 PHP
让ThinkPHP支持大小写url地址访问的方法
2014/10/31 PHP
Linux系统下php获得系统分区信息的方法
2015/03/30 PHP
解析瀑布流布局:JS+绝对定位的实现
2013/05/08 Javascript
JavaScript截取字符串的2个函数介绍
2014/08/27 Javascript
ubuntu下安装nodejs以及升级的办法
2015/05/08 NodeJs
使用Node.js处理前端代码文件的编码问题
2016/02/16 Javascript
AngularJS基础 ng-repeat 指令简单示例
2016/08/03 Javascript
JavaScript实现点击按钮复制指定区域文本(推荐)
2016/11/25 Javascript
input输入密码变黑点密文的实现方法
2017/01/09 Javascript
原生js获取浏览器窗口及元素宽高常用方法集合
2017/01/18 Javascript
JavaScript 巧学巧用
2017/05/23 Javascript
Web技术实现移动监测的介绍
2017/09/18 Javascript
Nodejs中怎么实现函数的串行执行
2019/03/02 NodeJs
微信小程序实现自定义动画弹框/提示框的方法实例
2020/11/06 Javascript
Python下的twisted框架入门指引
2015/04/15 Python
在Django的模板中使用认证数据的方法
2015/07/23 Python
python输出pdf文档的实例
2020/02/13 Python
python中的 zip函数详解及用法举例
2020/02/16 Python
Selenium Webdriver元素定位的八种常用方式(小结)
2021/01/13 Python
图解CSS3制作圆环形进度条的实例教程
2016/05/26 HTML / CSS
白兰氏健康Mall:BRAND’S
2017/11/13 全球购物
荷兰DOD药房中文官网:DeOnlineDrogist
2020/12/27 全球购物
斯福泰克软件测试面试题
2015/02/16 面试题
大学生表扬信范文
2014/01/09 职场文书
大型车展策划方案
2014/02/01 职场文书
党校培训自我鉴定
2014/02/01 职场文书
英语国培研修感言
2014/02/13 职场文书
财务内勤岗位职责
2014/04/17 职场文书
2014年班主任自我评价范文
2014/04/23 职场文书
职工擅自离岗检讨书
2014/09/23 职场文书
个人对照检查材料思想汇报
2014/09/26 职场文书
交通事故赔偿协议书怎么写
2014/10/04 职场文书
golang json数组拼接的实例
2021/04/28 Golang
解决Python中的modf()函数取小数部分不准确问题
2021/05/28 Python