Python爬虫设置ip代理过程解析


Posted in Python onJuly 20, 2020

1、get方式:如何为爬虫添加ip代理,设置Request header(请求头)

import urllib 
import urllib.request
import urllib.parse
import random
import time
from fake_useragent import UserAgent
ua = UserAgent()
url = "http://www.baidu.com"
########################################################
'''
设置ip代理
iplist = [ '127.0.0.1:80']  #可自行上网找一些代理
proxy_support = urllib.request.ProxyHandler({'http':random.choice(iplist)}) #也可以设置为https,要看你的代理支不支持
opener = urllib.request.build_opener(proxy_support)
'''
########################################################
'''无ip代理'''
opener = urllib.request.build_opener()

'''f12查看请求头添加即可,不一定都需要全添加↓↓↓'''
opener.addheaders = [('Host', 'newtab.firefoxchina.cn'),
           ('User-Agent',ua.random),
           ('Accept-Encoding','deflate, br'),
           ('Accept', 'text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,*/*;q=0.8'),
           ('Accept-Language', 'zh-CN,zh;q=0.8,zh-TW;q=0.7,zh-HK;q=0.5,en-US;q=0.3,en;q=0.2'),
           ('Connection', 'keep-alive'),
           ('Upgrade-Insecure-Requests',1),
           ('Cookie', '__gads=ID=138080209be66bf8:T=1592037395:S=ALNI_Ma-g9wHmfxFL4GCy9veAjJrJRsNmg; Hm_lvt_dd4738b5fb302cb062ef19107df5d2e4=1592449208,1592471447,1592471736,1594001802; uid=rBADnV7m04mi8wRJK3xYAg=='),
          ]
urllib.request.install_opener(opener)
while True:
  try:
    response = urllib.request.urlopen(url)
    break
  except Exception as e:
    print("错误信息:" + str(e))
    time.sleep(3)
html = response.read().decode("utf-8")
print(html)

2、post方式添加载荷(此处是打比方),修改urllib.request.install_opener(opener)以下的代码即可

urllib.request.install_opener(opener)
# data = {}    #当页面提交数据是有载荷但是载荷内容为空时,必须以data = {}传参,不然无法获取网页数据
data = {'_csrf':'请把',
    'collection-name':'载荷的参数',
    'description':'以这种形式',
    '_csrf':'装载'
    }
data = urllib.parse.urlencode(data).encode('utf-8')
req = urllib.request.Request(url,data)
while True:
  try:
    response = urllib.request.urlopen(req)
    break
  except Exception as e:
    print("错误信息:" + str(e))
    time.sleep(3)
html = response.read().decode("utf-8")

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python基础教程之自定义函数介绍
Aug 29 Python
Python 专题一 函数的基础知识
Mar 16 Python
详解python string类型 bytes类型 bytearray类型
Dec 16 Python
浅谈配置OpenCV3 + Python3的简易方法(macOS)
Apr 02 Python
使用Python开发SQLite代理服务器的方法
Dec 07 Python
python验证身份证信息实例代码
May 06 Python
如何运行.ipynb文件的图文讲解
Jun 27 Python
详解Django admin高级用法
Nov 06 Python
使用 Python 合并多个格式一致的 Excel 文件(推荐)
Dec 09 Python
Selenium alert 弹窗处理的示例代码
Aug 06 Python
python判断一个变量是否已经设置的方法
Aug 13 Python
十个Python自动化常用操作,即拿即用
May 10 Python
Python如何使用27行代码绘制星星图
Jul 20 #Python
tensorflow基于CNN实战mnist手写识别(小白必看)
Jul 20 #Python
基于python实现生成指定大小txt文档
Jul 20 #Python
python中upper是做什么用的
Jul 20 #Python
Pytorch框架实现mnist手写库识别(与tensorflow对比)
Jul 20 #Python
python集合能干吗
Jul 19 #Python
python如何建立全零数组
Jul 19 #Python
You might like
PHP可变函数的使用详解
2013/06/14 PHP
PHP模拟http请求的方法详解
2016/11/09 PHP
分享5个非常有用的Laravel Blade指令
2018/05/30 PHP
PHP命名空间与自动加载类详解
2018/09/04 PHP
Yii框架学习笔记之session与cookie简单操作示例
2019/04/30 PHP
JavaScript经典效果集锦
2010/07/06 Javascript
jQuery基础框架浅入剖析
2012/12/27 Javascript
上传的js验证(图片/文件的扩展名)
2013/04/25 Javascript
jQuery实现复选框成对选择及对应取消的方法
2015/03/03 Javascript
javascript字符串与数组转换汇总
2015/05/26 Javascript
JavaScript和jquery获取父级元素、子级元素、兄弟元素的方法
2016/06/05 Javascript
关于backbone url请求中参数带有中文存入数据库是乱码的快速解决办法
2016/06/13 Javascript
浅谈js内置对象Math的属性和方法(推荐)
2016/09/19 Javascript
angularjs 中$apply,$digest,$watch详解
2016/10/13 Javascript
jQuery实现页面滚动时智能浮动定位
2017/01/08 Javascript
Ionic2调用本地SQlite实例
2017/04/22 Javascript
element ui 对话框el-dialog关闭事件详解
2018/02/26 Javascript
js调用设备摄像头的方法
2018/07/19 Javascript
浅谈VUE单页应用首屏加载速度优化方案
2018/08/28 Javascript
微信小程序实现拍照画布指定区域生成图片
2019/07/18 Javascript
介绍Python的Django框架中的静态资源管理器django-pipeline
2015/04/25 Python
Java多线程编程中ThreadLocal类的用法及深入
2016/06/21 Python
pytorch 数据处理:定义自己的数据集合实例
2019/12/31 Python
python 实现弹球游戏的示例代码
2020/11/17 Python
Charlotte Tilbury美国官网:英国美妆品牌
2017/10/13 全球购物
英国和世界各地鲜花速递专家:Arena Flowers
2018/02/10 全球购物
世界上最好的旅行夹克:BauBax
2018/12/23 全球购物
煤矿班组长的职责
2013/12/25 职场文书
文化活动实施方案
2014/03/28 职场文书
法人代表授权委托书
2014/04/08 职场文书
服务之星事迹材料
2014/05/03 职场文书
优秀的应届生自荐信
2014/05/23 职场文书
见习报告的格式
2014/11/04 职场文书
药品销售内勤岗位职责
2015/04/13 职场文书
护士心得体会范文
2016/01/25 职场文书
python中的装饰器该如何使用
2021/06/18 Python