利用python分析access日志的方法


Posted in Javascript onOctober 26, 2016

前言

WAF上线之后,处理最多的是误报消除。

产生误报有多种原因,比如web应用源码编写时允许客户端提交过多的cookie;比如单个参数提交的数值太大。

把误报降低到了可接受的范围后,还要关注漏报。WAF不是神,任何WAF都可能被绕过。所以还需要定位漏过的攻击,明确漏报的原因,才能update WAF的策略。

要定位漏报,就必须分析Web应用的访问日志了。一个站点,每天产生的access日志大概接近1GB,显然靠肉眼看是不现实的。这就需要用python帮助自动分析。

实现思路

拿我司某Web系统举例:

     apache开启了access日志记录

     日志规则是每小时生成一个日志文件,以站点名称为文件名,以日期+时间为后缀。例如:special.XXXXXX.com.cn.2016101001

要分析这些散碎的日志文件,我的思路如下:

     1、根据用户命令行输入获取日志文件所在目录;

     2、遍历目录下所有文件,合并到一个文件;

     3、定义web攻击常见payload的字符串:

          SQLi的:select、union、+?+;

          Struts的:ognl、java

          webshell常见的:base64、eval、excute

使用正则逐行匹配,将命中的日志复制到单独的文件。

实现代码

代码如下:

# -*-coding: utf-8 -*-
import os,re,sys
if len(sys.argv) != 2 :
  print 'Usage : python logaudit.py <path>'
  sys.exit()
logpath = sys.argv[1]
#获取输入参数的文件路径'
merge = re.compile(r'.*(\d[10])')
for root , dirs , files in os.walk(logpath):
  for line in files:
    #遍历日志文件夹,合并所有内容到一个文件
    pipei = merge.match(line)
    if pipei != None:
      tmppath = root + '\\' +line
      logread1 = open(tmppath,'r')
      logread = logread1.read()
      log2txt = open('.\\log.txt','a')
      log2txt.write(logread)
      log2txt.close()
      logread1.close()
    else:
      exit
log = open('.//log.txt','r')
logread = log.readlines()
auditString = re.compile(r'.*[^_][sS][eE][lL][eE][cC][tT][^.].*|.*[uU][nN][iI][Oo][nN].*|.*[bB][aA][sS][eE][^.].*|.*[oO][gG][nN][lL].*|.*[eE][vV][aA][lL][(].*|.*[eE][xX][cC][uU][tT][eE].*')
writelog = open('.//result.txt','a')
for lines in logread:
  auditResult = auditString.match(lines)
  if auditResult != None:
    writelog.write(auditResult.group())
    writelog.write('\n')
  else:
    exit
writelog.close()
log.close()

总结

以上就是这篇文章的全部内容了,希望本文的内容对大家的学习或者工作能带来一定的帮助,如果有疑问大家可以留言交流。

Javascript 相关文章推荐
js获取GridView中行数据的两种方法 分享
Jul 13 Javascript
JavaScript中的函数模式详解
Feb 11 Javascript
PassWord输入框代码分享
Jun 07 Javascript
简单实现js拖拽效果
Jul 25 Javascript
浅谈AngularJS中使用$resource(已更新)
Sep 14 Javascript
vue 粒子特效的示例代码
Sep 19 Javascript
vue-star评星组件开发实例
Mar 01 Javascript
在 Angular6 中使用 HTTP 请求服务端数据的步骤详解
Aug 06 Javascript
layui的table中显示图片方法
Aug 17 Javascript
Vue组件间通信方法总结(父子组件、兄弟组件及祖先后代组件间)
Apr 17 Javascript
微信小程序间使用navigator跳转传值问题实例分析
Mar 27 Javascript
Vue中keep-alive组件的深入理解
Aug 23 Javascript
浅谈jQuery绑定事件会叠加的解决方法和心得总结
Oct 26 #Javascript
关于Jquery中的事件绑定总结
Oct 26 #Javascript
IE8利用自带的setCapture和releaseCapture解决iframe的拖拽事件方法
Oct 25 #Javascript
理解JavaScript原型链
Oct 25 #Javascript
Ztree新增角色和编辑角色回显问题的解决
Oct 25 #Javascript
jQuery+json实现动态创建复杂表格table的方法
Oct 25 #Javascript
jQuery实现的小图列表,大图展示效果幻灯片示例
Oct 25 #Javascript
You might like
PHP初学者头疼问题总结
2006/07/08 PHP
一个显示天气预报的程序
2006/10/09 PHP
网站当前的在线人数
2006/10/09 PHP
php指定函数参数默认值示例代码
2013/12/04 PHP
IE7提供XMLHttpRequest对象为兼容
2007/03/08 Javascript
发布一个基于javascript的动画类 Fx.js
2010/11/05 Javascript
ASP.NET jQuery 实例13 原创jQuery文本框字符限制插件-TextArea Counter
2012/02/03 Javascript
javascript时间函数基础介绍
2013/03/28 Javascript
jquery bind(click)传参让列表中每行绑定一个事件
2014/08/06 Javascript
javascript删除元素节点removeChild()用法实例
2015/05/26 Javascript
js实现类似菜单风格的TAB选项卡效果代码
2015/08/28 Javascript
Angularjs实现带查找筛选功能的select下拉框示例代码
2016/10/04 Javascript
bootstrap下拉菜单使用方法解析
2017/01/13 Javascript
JavaScript实现无穷滚动加载数据
2017/05/06 Javascript
angular.js实现购物车功能
2017/10/23 Javascript
详解JS模块导入导出
2017/12/20 Javascript
修改Nodejs内置的npm默认配置路径方法
2018/05/13 NodeJs
vue移动端项目缓存问题实践记录
2018/10/29 Javascript
深入了解js原型模式
2019/05/30 Javascript
解决vue prop传值default属性如何使用,为何不生效的问题
2020/09/21 Javascript
jupyter安装小结
2016/03/13 Python
python中Apriori算法实现讲解
2017/12/10 Python
Python实现的朴素贝叶斯算法经典示例【测试可用】
2018/06/13 Python
python中文编码与json中文输出问题详解
2018/08/24 Python
python并发编程多进程 互斥锁原理解析
2019/08/20 Python
Python数据可视化:饼状图的实例讲解
2019/12/07 Python
Python实现非正太分布的异常值检测方式
2019/12/09 Python
使用python实现CGI环境搭建过程解析
2020/04/28 Python
Python CategoricalDtype自定义排序实现原理解析
2020/09/11 Python
尼克松手表官网:Nixon手表
2019/03/17 全球购物
员工培训邀请函
2014/01/11 职场文书
高三政治教学反思
2014/02/06 职场文书
高校教师自荐信范文
2014/03/13 职场文书
党的群众路线教育实践活动总结报告
2014/07/03 职场文书
少年派的奇幻漂流观后感
2015/06/08 职场文书
详解如何使用Nginx解决跨域问题
2022/05/06 Servers