python 爬虫 批量获取代理ip的实例代码


Posted in Python onMay 22, 2018

实例如下所示:

import urllib.request
import os, re,sys,time
try:
 from StringIO import StringIO
except ImportError:
 from io import StringIO
loca = re.compile(r"""ion":"\D+", "ti""")
#伪装成浏览器
header = {'User-Agent':'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/44.0.2403.157 Safari/537.36'}
class Getip():
 def __init__(self,diqu):
  self.ur ={"xicidaili国内普通代理 --1线":"http://www.xicidaili.com/nt/",
        
    "ip84国内普通代理 --2线":'http://www.ip84.com/dlpn-http/',
        
    'xicidaili国内高匿名代理 --1线':'http://www.xicidaili.com/nn/',
       
    'ip84国内高匿名代理 --2线':'http://www.ip84.com/dlgn-http/',
    
    'xicidaili国外高匿名代理 --1线':'http://www.xicidaili.com/wn/',
    
    'ip84国外高匿名代理 --2线':'http://www.ip84.com/gwgn-http/',
    'xicidaili国外普通代理 --1线':'http://www.xicidaili.com/wt/',
    'haodailiip国内混合代理 --3线':'http://www.haodailiip.com/guonei/',
    'haodailiip国外混合代理 --3线':'http://www.haodailiip.com/guoji/',
        }
  self.diqu = diqu
 
 def urlopen(self,url):
  global header
  try:
   req = urllib.request.Request(url, None, header)
   res=urllib.request.urlopen(req)
  
   return res
  except:
   pass
 def getip(self,ren):
  '''url = "http://proxy.ipcn.org/proxylist.html"#代理IP页面
  ip_proxy_re = re.compile(r"""\d{1,3}\.\d{1,3}\.\d{1,3}\.\d{1,3}:\d{1,}""")# 直接匹配 xxx.xxx.xxx.xxx:xxxx'''
  
  url = self.ur[self.diqu]+str(ren)
  
  ip_proxy_re = re.compile(r'(\d{1,3}\.\d{1,3}\.\d{1,3}\.\d{1,3})\s*</td>\s*<td>\s*(\d{1,})\s*</td>\s*<[^\u4E00-\u9FA5]+>([\u4E00-\u9FA5]*\s*[\u4E00-\u9FA5]*\s*[\u4E00-\u9FA5]*)\s*<')
  #################################通用正则匹配的  格式 是  (IP,端口,地区) 地区有可能包含换行和空格
  try:
   data = self.urlopen(url).read().decode('utf-8')
  except:
   return None
  
  self.rel = []
  
  ip = ip_proxy_re.findall(data)
  ##########返回的IP 就是 正则匹配的结果(IP,端口,地区) 地区有可能包含换行和空格
  
  return ip
  
if __name__ == '__main__':
 g=Getip("xicidaili国内普通代理 --1线")
 import pprint
 for x in range(4):
  ips = g.getip(1)
  print('获取到ip地址一共:',len(ips))
  pprint.pprint(ips)

以上这篇python 爬虫 批量获取代理ip的实例代码就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
详解Python中的Cookie模块使用
Jul 06 Python
Python中的super()方法使用简介
Aug 14 Python
Python制作钉钉加密/解密工具
Dec 07 Python
Python编程实现的图片识别功能示例
Aug 03 Python
单利模式及python实现方式详解
Mar 20 Python
Python爬取个人微信朋友信息操作示例
Aug 03 Python
Python实现html转换为pdf报告(生成pdf报告)功能示例
May 04 Python
Pandas之groupby( )用法笔记小结
Jul 23 Python
Python 使用threading+Queue实现线程池示例
Dec 21 Python
python如何进行矩阵运算
Jun 05 Python
python中的sys模块和os模块
Mar 20 Python
python 获取当天每个准点时间戳的实例
May 22 #Python
selenium+python 去除启动的黑色cmd窗口方法
May 22 #Python
python3实现163邮箱SMTP发送邮件
May 22 #Python
django请求返回不同的类型图片json,xml,html的实例
May 22 #Python
Django使用HttpResponse返回图片并显示的方法
May 22 #Python
python实现最长公共子序列
May 22 #Python
使用python存储网页上的图片实例
May 22 #Python
You might like
php使用sql server验证连接数据库的方法
2014/12/25 PHP
搭建基于Docker的PHP开发环境的详细教程
2015/07/01 PHP
PHP实现的文件操作类及文件下载功能示例
2016/12/24 PHP
js下用层来实现select的title提示属性
2010/02/23 Javascript
输入框的字数时时统计—关于 onpropertychange 和 oninput 使用
2011/10/21 Javascript
简单的代码实现jquery定时器
2013/11/17 Javascript
JavaScript点击按钮后弹出透明浮动层的方法
2015/05/11 Javascript
举例讲解JavaScript substring()的使用方法
2015/11/09 Javascript
jQuery validate插件实现ajax验证重复的2种方法
2016/01/22 Javascript
jQuery Easyui学习之datagrid 动态添加、移除editor
2016/01/27 Javascript
纯js的右下角弹窗实例
2017/03/12 Javascript
vue.js异步上传文件前后端实现代码
2017/08/22 Javascript
详解angular如何调用HTML字符串的方法
2018/06/30 Javascript
vue中解决chrome浏览器自动播放音频和MP3语音打包到线上的实现方法
2020/10/09 Javascript
swiper实现导航滚动效果
2020/12/13 Javascript
python基础教程之对象和类的实际运用
2014/08/29 Python
python 系统调用的实例详解
2017/07/11 Python
解决python nohup linux 后台运行输出的问题
2018/05/11 Python
Python中偏函数用法示例
2018/06/07 Python
Python3对称加密算法AES、DES3实例详解
2018/12/06 Python
python SVM 线性分类模型的实现
2019/07/19 Python
python实现桌面托盘气泡提示
2019/07/29 Python
python画蝴蝶曲线图的实例
2019/11/21 Python
Python: 传递列表副本方式
2019/12/19 Python
python GUI库图形界面开发之PyQt5日期时间控件QDateTimeEdit详细使用方法与实例
2020/02/27 Python
Python 实现RSA加解密文本文件
2020/12/30 Python
美国在线精品家居网站:Burke Decor
2017/04/12 全球购物
Notino芬兰:购买香水和化妆品
2019/04/15 全球购物
阿迪达斯新加坡官方网站:adidas新加坡
2019/12/06 全球购物
学习雷锋标语
2014/06/25 职场文书
小学生竞选班干部演讲稿(5篇)
2014/09/12 职场文书
龙猫观后感
2015/06/09 职场文书
2019年入党思想汇报
2019/03/25 职场文书
SQL Server连接查询的实用教程
2021/04/07 SQL Server
详解Redis实现限流的三种方式
2021/04/27 Redis
Windows安装Anaconda3的方法及使用过程详解
2021/06/11 Python