python 爬虫 批量获取代理ip的实例代码


Posted in Python onMay 22, 2018

实例如下所示:

import urllib.request
import os, re,sys,time
try:
 from StringIO import StringIO
except ImportError:
 from io import StringIO
loca = re.compile(r"""ion":"\D+", "ti""")
#伪装成浏览器
header = {'User-Agent':'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/44.0.2403.157 Safari/537.36'}
class Getip():
 def __init__(self,diqu):
  self.ur ={"xicidaili国内普通代理 --1线":"http://www.xicidaili.com/nt/",
        
    "ip84国内普通代理 --2线":'http://www.ip84.com/dlpn-http/',
        
    'xicidaili国内高匿名代理 --1线':'http://www.xicidaili.com/nn/',
       
    'ip84国内高匿名代理 --2线':'http://www.ip84.com/dlgn-http/',
    
    'xicidaili国外高匿名代理 --1线':'http://www.xicidaili.com/wn/',
    
    'ip84国外高匿名代理 --2线':'http://www.ip84.com/gwgn-http/',
    'xicidaili国外普通代理 --1线':'http://www.xicidaili.com/wt/',
    'haodailiip国内混合代理 --3线':'http://www.haodailiip.com/guonei/',
    'haodailiip国外混合代理 --3线':'http://www.haodailiip.com/guoji/',
        }
  self.diqu = diqu
 
 def urlopen(self,url):
  global header
  try:
   req = urllib.request.Request(url, None, header)
   res=urllib.request.urlopen(req)
  
   return res
  except:
   pass
 def getip(self,ren):
  '''url = "http://proxy.ipcn.org/proxylist.html"#代理IP页面
  ip_proxy_re = re.compile(r"""\d{1,3}\.\d{1,3}\.\d{1,3}\.\d{1,3}:\d{1,}""")# 直接匹配 xxx.xxx.xxx.xxx:xxxx'''
  
  url = self.ur[self.diqu]+str(ren)
  
  ip_proxy_re = re.compile(r'(\d{1,3}\.\d{1,3}\.\d{1,3}\.\d{1,3})\s*</td>\s*<td>\s*(\d{1,})\s*</td>\s*<[^\u4E00-\u9FA5]+>([\u4E00-\u9FA5]*\s*[\u4E00-\u9FA5]*\s*[\u4E00-\u9FA5]*)\s*<')
  #################################通用正则匹配的  格式 是  (IP,端口,地区) 地区有可能包含换行和空格
  try:
   data = self.urlopen(url).read().decode('utf-8')
  except:
   return None
  
  self.rel = []
  
  ip = ip_proxy_re.findall(data)
  ##########返回的IP 就是 正则匹配的结果(IP,端口,地区) 地区有可能包含换行和空格
  
  return ip
  
if __name__ == '__main__':
 g=Getip("xicidaili国内普通代理 --1线")
 import pprint
 for x in range(4):
  ips = g.getip(1)
  print('获取到ip地址一共:',len(ips))
  pprint.pprint(ips)

以上这篇python 爬虫 批量获取代理ip的实例代码就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python图片裁剪实例代码(如头像裁剪)
Jun 21 Python
利用aardio给python编写图形界面
Aug 21 Python
详解python实现识别手写MNIST数字集的程序
Aug 03 Python
python可视化爬虫界面之天气查询
Jul 03 Python
通过PHP与Python代码对比的语法差异详解
Jul 10 Python
Django外键(ForeignKey)操作以及related_name的作用详解
Jul 29 Python
基于Python的图像数据增强Data Augmentation解析
Aug 13 Python
python中的global关键字的使用方法
Aug 20 Python
Python使用matplotlib实现交换式图形显示功能示例
Sep 06 Python
Python Celery多队列配置代码实例
Nov 22 Python
Python3打包exe代码2种方法实例解析
Feb 17 Python
django美化后台django-suit的安装配置操作
Jul 12 Python
python 获取当天每个准点时间戳的实例
May 22 #Python
selenium+python 去除启动的黑色cmd窗口方法
May 22 #Python
python3实现163邮箱SMTP发送邮件
May 22 #Python
django请求返回不同的类型图片json,xml,html的实例
May 22 #Python
Django使用HttpResponse返回图片并显示的方法
May 22 #Python
python实现最长公共子序列
May 22 #Python
使用python存储网页上的图片实例
May 22 #Python
You might like
二招解决php乱码问题
2012/03/25 PHP
PHP中file_get_contents高?用法实例
2014/09/24 PHP
php中文字符串截取方法实例总结
2014/09/30 PHP
学习php设计模式 php实现建造者模式
2015/12/07 PHP
yii2中dropDownList实现二级和三级联动写法
2017/04/26 PHP
浅谈Laravel中的三种中间件的作用
2019/10/13 PHP
PHP常用函数之获取汉字首字母功能示例
2019/10/21 PHP
使用Chart.js图表库制作漂亮的响应式表单
2015/10/28 Javascript
JavaScript保留关键字汇总
2015/12/01 Javascript
jQuery实现查找最近父节点的方法
2016/06/23 Javascript
AngularJS 过滤器(自带和自建)详解
2016/09/19 Javascript
AngularJS通过$http和服务器通信详解
2016/09/21 Javascript
jquery获取input type=text中的值的各种方式(总结)
2016/12/02 Javascript
JavaScript实现修改伪类样式
2017/11/27 Javascript
vue如何实现自定义底部菜单栏
2019/07/01 Javascript
layui 点击重置按钮, select 并没有被重置的解决方法
2019/09/03 Javascript
vue router-link 默认a标签去除下划线的实现
2020/11/06 Javascript
Python实现对excel文件列表值进行统计的方法
2015/07/25 Python
python中Pycharm 输出中文或打印中文乱码现象的解决办法
2017/06/16 Python
pytorch + visdom CNN处理自建图片数据集的方法
2018/06/04 Python
Flask实现图片的上传、下载及展示示例代码
2018/08/03 Python
Python使用pyshp库读取shapefile信息的方法
2018/12/29 Python
pip安装提示Twisted错误问题(Python3.6.4安装Twisted错误)
2020/05/09 Python
Python中的整除和取模实例
2020/06/03 Python
纯CSS3绘制打火机动画火焰效果
2016/07/18 HTML / CSS
Becextech新西兰:数码单反相机和手机在线商店
2018/04/27 全球购物
西班牙著名的珠宝首饰品牌:P D PAOLA
2018/09/15 全球购物
工程测量与监理专业应届生求职信
2013/11/27 职场文书
护士自我介绍信
2014/01/13 职场文书
学校元旦晚会方案
2014/02/19 职场文书
高中学生干部学习的自我评价
2014/02/21 职场文书
2014年班主任自我评价范文
2014/04/23 职场文书
超市优秀员工事迹材料
2014/05/01 职场文书
仓管员岗位职责
2015/02/03 职场文书
社区党务工作总结2015
2015/05/19 职场文书
学习新党章心得体会2016
2016/01/15 职场文书