python 爬虫 批量获取代理ip的实例代码


Posted in Python onMay 22, 2018

实例如下所示:

import urllib.request
import os, re,sys,time
try:
 from StringIO import StringIO
except ImportError:
 from io import StringIO
loca = re.compile(r"""ion":"\D+", "ti""")
#伪装成浏览器
header = {'User-Agent':'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/44.0.2403.157 Safari/537.36'}
class Getip():
 def __init__(self,diqu):
  self.ur ={"xicidaili国内普通代理 --1线":"http://www.xicidaili.com/nt/",
        
    "ip84国内普通代理 --2线":'http://www.ip84.com/dlpn-http/',
        
    'xicidaili国内高匿名代理 --1线':'http://www.xicidaili.com/nn/',
       
    'ip84国内高匿名代理 --2线':'http://www.ip84.com/dlgn-http/',
    
    'xicidaili国外高匿名代理 --1线':'http://www.xicidaili.com/wn/',
    
    'ip84国外高匿名代理 --2线':'http://www.ip84.com/gwgn-http/',
    'xicidaili国外普通代理 --1线':'http://www.xicidaili.com/wt/',
    'haodailiip国内混合代理 --3线':'http://www.haodailiip.com/guonei/',
    'haodailiip国外混合代理 --3线':'http://www.haodailiip.com/guoji/',
        }
  self.diqu = diqu
 
 def urlopen(self,url):
  global header
  try:
   req = urllib.request.Request(url, None, header)
   res=urllib.request.urlopen(req)
  
   return res
  except:
   pass
 def getip(self,ren):
  '''url = "http://proxy.ipcn.org/proxylist.html"#代理IP页面
  ip_proxy_re = re.compile(r"""\d{1,3}\.\d{1,3}\.\d{1,3}\.\d{1,3}:\d{1,}""")# 直接匹配 xxx.xxx.xxx.xxx:xxxx'''
  
  url = self.ur[self.diqu]+str(ren)
  
  ip_proxy_re = re.compile(r'(\d{1,3}\.\d{1,3}\.\d{1,3}\.\d{1,3})\s*</td>\s*<td>\s*(\d{1,})\s*</td>\s*<[^\u4E00-\u9FA5]+>([\u4E00-\u9FA5]*\s*[\u4E00-\u9FA5]*\s*[\u4E00-\u9FA5]*)\s*<')
  #################################通用正则匹配的  格式 是  (IP,端口,地区) 地区有可能包含换行和空格
  try:
   data = self.urlopen(url).read().decode('utf-8')
  except:
   return None
  
  self.rel = []
  
  ip = ip_proxy_re.findall(data)
  ##########返回的IP 就是 正则匹配的结果(IP,端口,地区) 地区有可能包含换行和空格
  
  return ip
  
if __name__ == '__main__':
 g=Getip("xicidaili国内普通代理 --1线")
 import pprint
 for x in range(4):
  ips = g.getip(1)
  print('获取到ip地址一共:',len(ips))
  pprint.pprint(ips)

以上这篇python 爬虫 批量获取代理ip的实例代码就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python实现dnspod自动更新dns解析的方法
Feb 14 Python
Python中urllib+urllib2+cookielib模块编写爬虫实战
Jan 20 Python
Python获取某一天是星期几的方法示例
Jan 17 Python
python入门前的第一课 python怎样入门
Mar 06 Python
python使用turtle绘制分形树
Jun 22 Python
python获取地震信息 微信实时推送
Jun 18 Python
Python项目 基于Scapy实现SYN泛洪攻击的方法
Jul 23 Python
Python字典常见操作实例小结【定义、添加、删除、遍历】
Oct 25 Python
python 解决Fatal error in launcher:错误问题
May 21 Python
使用jupyter notebook运行python和R的步骤
Aug 13 Python
Django haystack实现全文搜索代码示例
Nov 28 Python
刚学完怎么用Python实现定时任务,转头就跑去撩妹!
Jun 05 Python
python 获取当天每个准点时间戳的实例
May 22 #Python
selenium+python 去除启动的黑色cmd窗口方法
May 22 #Python
python3实现163邮箱SMTP发送邮件
May 22 #Python
django请求返回不同的类型图片json,xml,html的实例
May 22 #Python
Django使用HttpResponse返回图片并显示的方法
May 22 #Python
python实现最长公共子序列
May 22 #Python
使用python存储网页上的图片实例
May 22 #Python
You might like
深入理解PHP原理之错误抑制与内嵌HTML分析
2011/05/02 PHP
PHP--用万网的接口实现域名查询功能
2012/12/13 PHP
php生成QRcode实例
2014/09/22 PHP
laravel 5.1下php artisan migrate的使用注意事项总结
2017/06/07 PHP
ASP SQL防注入的方法
2008/12/25 Javascript
jQuery Ajax 实例全解析
2011/04/20 Javascript
按下Enter焦点移至下一个控件的实现js代码
2013/12/11 Javascript
javascript中select下拉框的用法总结
2016/01/07 Javascript
jquery分页插件jquery.pagination.js实现无刷新分页
2016/04/01 Javascript
原生ajax处理json格式数据的实例代码
2016/12/25 Javascript
原生js实现日期计算器功能
2017/02/17 Javascript
详解AngularJS2 Http服务
2017/06/26 Javascript
javaScript 连接打印机,打印小票的实例
2017/12/29 Javascript
vue中使用v-model完成组件间的通信
2019/08/22 Javascript
js实现移动端tab切换时下划线滑动效果
2019/09/08 Javascript
在vue项目实现一个ctrl+f的搜索功能
2020/02/28 Javascript
Vue自定义render统一项目组弹框功能
2020/06/07 Javascript
python实现ftp客户端示例分享
2014/02/17 Python
python的Tqdm模块的使用
2018/01/10 Python
Python使用pymongo模块操作MongoDB的方法示例
2018/07/20 Python
在python中pandas的series合并方法
2018/11/12 Python
python爬虫刷访问量 2019 7月
2019/08/01 Python
python计算二维矩形IOU实例
2020/01/18 Python
python中使用asyncio实现异步IO实例分析
2021/02/26 Python
Grid 宫格常用布局的实现
2020/01/10 HTML / CSS
HTML5拖放效果的实现代码
2016/11/17 HTML / CSS
使用phonegap查找联系人的实现方法
2017/03/31 HTML / CSS
电子信息专业学生自荐信
2013/11/09 职场文书
大学毕业感言
2014/01/10 职场文书
个人承诺书
2014/03/26 职场文书
音乐教师求职信范文
2015/03/20 职场文书
商业计划书格式、范文
2019/03/21 职场文书
一道JS算法面试题——冒泡、选择排序
2021/04/21 Javascript
Mysql数据库手动及定时备份步骤
2021/11/07 MySQL
基于Python实现将列表数据生成折线图
2022/03/23 Python
SQL Server中的游标介绍
2022/05/20 SQL Server