基于Python爬取fofa网页端数据过程解析


Posted in Python onJuly 13, 2020

FOFA-网络空间安全搜索引擎是网络空间资产检索系统(FOFA)是世界上数据覆盖更完整的IT设备搜索引擎,拥有全球联网IT设备更全的DNA信息。探索全球互联网的资产信息,进行资产及漏洞影响范围分析、应用分布统计、应用流行度态势感知等。

安装环境:

pip install requests
pip install lxml
pip install fire

使用命令:

python fofa.py -s=title="你的关键字" -o="结果输出文件" -c="你的cookie"

代码如下:

import requests,time,base64,fire
from lxml import etree
def fofasc(s,o,c):
  try:
    sbase64 = (base64.b64encode(s.encode('utf-8'))).decode('utf-8')
    cookies = {
      "_fofapro_ars_session": c
    }
 
    headers = {
      'User-Agent': 'Mozilla/5.0 (Linux; Android 7.1.2; PCRT00 Build/N2G48H; wv) AppleWebKit/537.36 (KHTML, like Gecko) Version/4.0 Chrome/66.0.3359.158 Safari/537.36 fanwe_app_sdk sdk_type/android sdk_version_name/4.0.1 sdk_version/2020042901 screen_width/720 screen_height/1280',
    }
    for i in range(1,1000):
      url = "https://www.fofa.so/result?q="+s+"&qbase64="+sbase64+"&full=true&page="+str(i)
      r = requests.get(url, headers=headers, cookies=cookies)
      soup = etree.HTML(r.text)
      result = soup.xpath('//*[@id="ajax_content"]/div/div/div/a/text()')
      print(result)
      if result != []:
        for rs in result:
          with open(o,mode="a+") as f:
            f.write(rs+"\n")
      else:
        print("已经获取不到任何数据,爬取完毕!")
        break
      time.sleep(2)
  except KeyboardInterrupt:
    print('用户退出')
if __name__ == '__main__':
  fire.Fire(fofasc)

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python 中 Meta Classes详解
Feb 13 Python
Python操作MySQL模拟银行转账
Mar 12 Python
python实现比对美团接口返回数据和本地mongo数据是否一致示例
Aug 09 Python
python实现的多任务版udp聊天器功能案例
Nov 13 Python
Python+Redis实现布隆过滤器
Dec 08 Python
Python第三方库的几种安装方式(小结)
Apr 03 Python
Python Excel vlookup函数实现过程解析
Jun 22 Python
Python基于正则表达式实现计算器功能
Jul 13 Python
python图片合成的示例
Nov 09 Python
python 下载文件的几种方法汇总
Jan 06 Python
如何用Python进行时间序列分解和预测
Mar 01 Python
Python生成九宫格图片的示例代码
Apr 14 Python
python利用os模块编写文件复制功能——copy()函数用法
Jul 13 #Python
python 制作python包,封装成可用模块教程
Jul 13 #Python
通过Python实现Payload分离免杀过程详解
Jul 13 #Python
python上selenium的弹框操作实现
Jul 13 #Python
python如何导入依赖包
Jul 13 #Python
python入门:argparse浅析 nargs='+'作用
Jul 12 #Python
浅谈Python 命令行参数argparse写入图片路径操作
Jul 12 #Python
You might like
php的一个登录的类 [推荐]
2007/03/16 PHP
php写的AES加密解密类分享
2014/06/20 PHP
PHP实现获取客户端IP并获取IP信息
2015/03/17 PHP
php实现字符串翻转的方法
2015/03/27 PHP
php析构函数的简单使用说明
2015/08/24 PHP
PHP关键特性之命名空间实例详解
2017/05/06 PHP
php实现微信公众号创建自定义菜单功能的实例代码
2019/06/11 PHP
TP3.2.3框架使用CKeditor编辑器在页面中上传图片的方法分析
2019/12/31 PHP
JS代码格式化和语法着色V2
2006/10/14 Javascript
jquery 无限级下拉菜单的简单实现代码
2014/02/21 Javascript
jquery获取颜色在ie和ff下的区别示例介绍
2014/03/28 Javascript
jquery的trigger和triggerHandler的区别示例介绍
2014/04/20 Javascript
jQuery 中国省市两级联动选择附图
2014/05/14 Javascript
使用原生js实现页面蒙灰(mask)效果示例代码
2014/06/20 Javascript
jquery和js实现对div的隐藏和显示方法
2014/09/26 Javascript
jQuery的几个我们必须了解的特点
2015/05/03 Javascript
JavaScript实现横向滑出的多级菜单效果
2015/10/09 Javascript
基于JavaScript实现快速转换文本语言(繁体中文和简体中文)
2016/03/07 Javascript
原生javascript AJAX 三级联动的实现代码
2018/05/04 Javascript
解决LayUI表单获取不到data的问题
2018/08/20 Javascript
vuejs选中当前样式active的实例
2018/08/22 Javascript
vue2.x集成百度UEditor富文本编辑器的方法
2018/09/21 Javascript
Phaser.js实现简单的跑酷游戏附源码下载
2018/10/26 Javascript
Node.js 深度调试方法解析
2020/07/28 Javascript
[06:24]DOTA2 2015国际邀请赛中国区预选赛第二日TOP10
2015/05/27 DOTA
Python for循环生成列表的实例
2018/06/15 Python
python+selenium打印当前页面的titl和url方法
2018/06/22 Python
浅析Python面向对象编程
2020/07/10 Python
拉飞逸官网:Lafayette 148 New York
2020/07/15 全球购物
大学生学习2014年全国两会心得体会
2014/03/12 职场文书
教师作风整改措施思想汇报
2014/10/12 职场文书
2015年幼儿园新年寄语
2014/12/08 职场文书
2015银行年终工作总结范文
2015/05/26 职场文书
2016年区委书记抓基层党建工作公开承诺书
2016/03/25 职场文书
使用pytorch实现线性回归
2021/04/11 Python
Java实现房屋出租系统详解
2021/10/05 Java/Android