实例探究Python以并发方式编写高性能端口扫描器的方法


Posted in Python onJune 14, 2016

关于端口扫描器
端口扫描工具(Port Scanner)指用于探测服务器或主机开放端口情况的工具。常被计算机管理员用于确认安全策略,同时被攻击者用于识别目标主机上的可运作的网络服务。

端口扫描定义是客户端向一定范围的服务器端口发送对应请求,以此确认可使用的端口。虽然其本身并不是恶意的网络活动,但也是网络攻击者探测目标主机服务,以利用该服务的已知漏洞的重要手段。端口扫描的主要用途仍然只是确认远程机器某个服务的可用性。

扫描多个主机以获取特定的某个端口被称为端口清扫(Portsweep),以此获取特定的服务。例如,基于SQL服务的计算机蠕虫就会清扫大量主机的同一端口以在 1433 端口上建立TCP连接。

Python实现

端口扫描器原理很简单,无非就是操作socket,能connect就认定这个端口开放着。

import socket 
def scan(port): 
  s = socket.socket() 
  if s.connect_ex(('localhost', port)) == 0: 
    print port, 'open' 
  s.close() 
if __name__ == '__main__': 
  map(scan,range(1,65536))

这样一个最简单的端口扫描器出来了。
等等喂,半天都没反应,那是因为socket是阻塞的,每次连接要等很久才超时。
我们自己给它加上的超时。

s.settimeout(0.1)

再跑一遍,感觉快多了。

多线程版本

import socket 
import threading 
def scan(port): 
  s = socket.socket() 
  s.settimeout(0.1) 
  if s.connect_ex(('localhost', port)) == 0: 
    print port, 'open' 
  s.close() 
 
if __name__ == '__main__': 
  threads = [threading.Thread(target=scan, args=(i,)) for i in xrange(1,65536)] 
  map(lambda x:x.start(),threads)

运行一下,哇,好快,快到抛出错误了。thread.error: can't start new thread。
想一下,这个进程开启了65535个线程,有两种可能,一种是超过最大线程数了,一种是超过最大socket句柄数了。在linux可以通过ulimit来修改。
如果不修改最大限制,怎么用多线程不报错呢?
加个queue,变成生产者-消费者模式,开固定线程。

多线程+队列版本

import socket 
import threading 
from Queue import Queue 
def scan(port): 
  s = socket.socket() 
  s.settimeout(0.1) 
  if s.connect_ex(('localhost', port)) == 0: 
    print port, 'open' 
  s.close() 
 
def worker(): 
  while not q.empty(): 
    port = q.get() 
    try: 
      scan(port) 
    finally: 
      q.task_done() 
 
if __name__ == '__main__': 
  q = Queue() 
  map(q.put,xrange(1,65535)) 
  threads = [threading.Thread(target=worker) for i in xrange(500)] 
  map(lambda x:x.start(),threads) 
  q.join()

这里开500个线程,不停的从队列取任务来做。

multiprocessing+队列版本
总不能开65535个进程吧?还是用生产者消费者模式

import multiprocessing 
def scan(port): 
  s = socket.socket() 
  s.settimeout(0.1) 
  if s.connect_ex(('localhost', port)) == 0: 
    print port, 'open' 
  s.close() 
 
def worker(q): 
  while not q.empty(): 
    port = q.get() 
    try: 
      scan(port) 
    finally: 
      q.task_done() 
 
if __name__ == '__main__': 
  q = multiprocessing.JoinableQueue() 
  map(q.put,xrange(1,65535)) 
  jobs = [multiprocessing.Process(target=worker, args=(q,)) for i in xrange(100)] 
  map(lambda x:x.start(),jobs)

注意这里把队列作为一个参数传入到worker中去,因为是process safe的queue,不然会报错。
还有用的是JoinableQueue(),顾名思义就是可以join()的。

gevent的spawn版本

from gevent import monkey; monkey.patch_all(); 
import gevent 
import socket 
... 
if __name__ == '__main__': 
  threads = [gevent.spawn(scan, i) for i in xrange(1,65536)] 
  gevent.joinall(threads)

注意monkey patch必须在被patch的东西之前import,不然会Exception KeyError.比如不能先import threading,再monkey patch.

gevent的Pool版本

from gevent import monkey; monkey.patch_all(); 
import socket 
from gevent.pool import Pool 
... 
if __name__ == '__main__': 
  pool = Pool(500) 
  pool.map(scan,xrange(1,65536)) 
  pool.join()

concurrent.futures版本

import socket 
from Queue import Queue 
from concurrent.futures import ThreadPoolExecutor 
... 
if __name__ == '__main__': 
  q = Queue() 
  map(q.put,xrange(1,65536)) 
  with ThreadPoolExecutor(max_workers=500) as executor: 
    for i in range(500): 
      executor.submit(worker,q)
Python 相关文章推荐
Python字符串的encode与decode研究心得乱码问题解决方法
Mar 23 Python
Python的shutil模块中文件的复制操作函数详解
Jul 05 Python
Python实现将sqlite数据库导出转成Excel(xls)表的方法
Jul 17 Python
Python学习之Anaconda的使用与配置方法
Jan 04 Python
Python基于jieba库进行简单分词及词云功能实现方法
Jun 16 Python
Python读取mat文件,并转为csv文件的实例
Jul 04 Python
python3+PyQt5 数据库编程--增删改实例
Jun 17 Python
Python利用scapy实现ARP欺骗的方法
Jul 23 Python
python实现代码统计器
Sep 19 Python
Python socket聊天脚本代码实例
Jan 02 Python
keras小技巧——获取某一个网络层的输出方式
May 23 Python
如何利用python 读取配置文件
Jan 06 Python
Python使用dis模块把Python反编译为字节码的用法详解
Jun 14 #Python
Python的Flask框架中使用Flask-Migrate扩展迁移数据库的教程
Jun 14 #Python
Python的Flask框架中使用Flask-SQLAlchemy管理数据库的教程
Jun 14 #Python
全面了解Python的getattr(),setattr(),delattr(),hasattr()
Jun 14 #Python
浅谈python中的getattr函数 hasattr函数
Jun 14 #Python
深入解析Python中的线程同步方法
Jun 14 #Python
详解Python中的Descriptor描述符类
Jun 14 #Python
You might like
PHP中的正规表达式(二)
2006/10/09 PHP
PHP自定义函数实现数组比较功能示例
2017/10/19 PHP
PHP+mysql防止SQL注入的方法小结
2019/04/27 PHP
mapper--图片热点区域高亮组件官方站点
2007/12/22 Javascript
js控制表单不能输入空格的小例子
2013/11/20 Javascript
JQuery处理json与ajax返回JSON实例代码
2014/01/03 Javascript
JavaScript中判断整数的多种方法总结
2014/11/08 Javascript
使用jQuery简单实现模拟浏览器搜索功能
2014/12/21 Javascript
Js为表单动态添加节点内容的方法
2015/02/10 Javascript
jquery实现动静态条形统计图
2015/08/17 Javascript
JavaScript类型系统之布尔Boolean类型详解
2016/06/26 Javascript
D3.js实现饼状图的方法详解
2016/09/21 Javascript
jquery设置css样式的多种方法(总结)
2017/02/21 Javascript
bootstrap fileinput组件整合Springmvc上传图片到本地磁盘
2017/05/11 Javascript
Vue单文件组件基础模板小结
2017/08/10 Javascript
Vue响应式原理深入解析及注意事项
2017/12/11 Javascript
layUI使用layer.open,在content打开数据表格,获取值并返回的方法
2019/09/26 Javascript
详解JavaScript自定义函数
2020/07/29 Javascript
Vue.extend 登录注册模态框的实现
2020/12/29 Vue.js
vue-cli 3如何使用vue-bootstrap-datetimepicker日期插件
2021/02/20 Vue.js
python selenium UI自动化解决验证码的4种方法
2018/01/05 Python
python爬虫爬取微博评论案例详解
2019/03/27 Python
python 实现查询Neo4j多节点的多层关系
2019/12/23 Python
Python hmac模块使用实例解析
2019/12/24 Python
2020版Python学习路线图(附学习资料)
2020/09/15 Python
Python 数据分析之逐块读取文本的实现
2020/12/14 Python
技术副厂长岗位职责
2013/12/26 职场文书
幼儿园元旦亲子活动方案
2014/02/17 职场文书
《风娃娃》教学反思
2014/04/19 职场文书
物流管理系毕业生求职信
2014/06/03 职场文书
市场调研项目授权委托书范本
2014/10/04 职场文书
社区节水倡议书
2015/04/29 职场文书
复兴之路观后感3000字
2015/06/02 职场文书
长江七号观后感
2015/06/11 职场文书
通讯稿范文
2015/07/22 职场文书
竞聘演讲报告:基本写作有哪些?附开头范文
2019/10/16 职场文书