基于Python爬取fofa网页端数据过程解析


Posted in Python onJuly 13, 2020

FOFA-网络空间安全搜索引擎是网络空间资产检索系统(FOFA)是世界上数据覆盖更完整的IT设备搜索引擎,拥有全球联网IT设备更全的DNA信息。探索全球互联网的资产信息,进行资产及漏洞影响范围分析、应用分布统计、应用流行度态势感知等。

安装环境:

pip install requests
pip install lxml
pip install fire

使用命令:

python fofa.py -s=title="你的关键字" -o="结果输出文件" -c="你的cookie"

代码如下:

import requests,time,base64,fire
from lxml import etree
def fofasc(s,o,c):
  try:
    sbase64 = (base64.b64encode(s.encode('utf-8'))).decode('utf-8')
    cookies = {
      "_fofapro_ars_session": c
    }
 
    headers = {
      'User-Agent': 'Mozilla/5.0 (Linux; Android 7.1.2; PCRT00 Build/N2G48H; wv) AppleWebKit/537.36 (KHTML, like Gecko) Version/4.0 Chrome/66.0.3359.158 Safari/537.36 fanwe_app_sdk sdk_type/android sdk_version_name/4.0.1 sdk_version/2020042901 screen_width/720 screen_height/1280',
    }
    for i in range(1,1000):
      url = "https://www.fofa.so/result?q="+s+"&qbase64="+sbase64+"&full=true&page="+str(i)
      r = requests.get(url, headers=headers, cookies=cookies)
      soup = etree.HTML(r.text)
      result = soup.xpath('//*[@id="ajax_content"]/div/div/div/a/text()')
      print(result)
      if result != []:
        for rs in result:
          with open(o,mode="a+") as f:
            f.write(rs+"\n")
      else:
        print("已经获取不到任何数据,爬取完毕!")
        break
      time.sleep(2)
  except KeyboardInterrupt:
    print('用户退出')
if __name__ == '__main__':
  fire.Fire(fofasc)

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python开发之IDEL(Python GUI)的使用方法图文详解
Nov 12 Python
一个基于flask的web应用诞生(1)
Apr 11 Python
Django中ORM表的创建和增删改查方法示例
Nov 15 Python
Python 和 JS 有哪些相同之处
Nov 23 Python
使用python获取csv文本的某行或某列数据的实例
Apr 03 Python
利用python打开摄像头及颜色检测方法
Aug 03 Python
python numpy 常用随机数的产生方法的实现
Aug 21 Python
Python基于字典实现switch case函数调用
Jul 22 Python
python连接mysql数据库并读取数据的实现
Sep 25 Python
django中ImageField的使用详解
Dec 21 Python
python opencv通过按键采集图片源码
May 20 Python
Python Pytorch查询图像的特征从集合或数据库中查找图像
Apr 09 Python
python利用os模块编写文件复制功能——copy()函数用法
Jul 13 #Python
python 制作python包,封装成可用模块教程
Jul 13 #Python
通过Python实现Payload分离免杀过程详解
Jul 13 #Python
python上selenium的弹框操作实现
Jul 13 #Python
python如何导入依赖包
Jul 13 #Python
python入门:argparse浅析 nargs='+'作用
Jul 12 #Python
浅谈Python 命令行参数argparse写入图片路径操作
Jul 12 #Python
You might like
修改apache配置文件去除thinkphp url中的index.php
2014/01/17 PHP
php 使用expat方式解析xml文件操作示例
2019/11/26 PHP
JavaScript加密解密7种方法总结分析
2007/10/07 Javascript
js 判断 enter 事件
2009/02/12 Javascript
jQuery EasyUI中对表格进行编辑的实现代码
2010/06/10 Javascript
JavaScript浏览器选项卡效果
2010/08/25 Javascript
JQuery与Ajax调用新浪API获取短网址的代码
2014/02/07 Javascript
JavaScript中实现map功能代码分享
2015/06/11 Javascript
js滚轮事件兼容性问题需要注意哪些
2016/11/15 Javascript
Vue2.0组件间数据传递示例
2017/03/07 Javascript
Vue组件之全局组件与局部组件的使用详解
2017/10/09 Javascript
JavaScript判断浏览器运行环境的详细方法
2019/06/30 Javascript
jquery实现掷骰子小游戏
2019/10/24 jQuery
[51:32]Optic vs Serenity 2018国际邀请赛淘汰赛BO3 第一场 8.22
2018/08/23 DOTA
使用python Django做网页
2013/11/04 Python
python删除过期log文件操作实例解析
2018/01/31 Python
python实现黑客字幕雨效果
2018/06/21 Python
详解Python使用Plotly绘图工具,绘制甘特图
2019/04/02 Python
pandas对dataFrame中某一个列的数据进行处理的方法
2019/07/08 Python
pytorch中的上采样以及各种反操作,求逆操作详解
2020/01/03 Python
pytorch 常用线性函数详解
2020/01/15 Python
200行python代码实现贪吃蛇游戏
2020/04/24 Python
Python虚拟环境venv用法详解
2020/05/25 Python
使用keras框架cnn+ctc_loss识别不定长字符图片操作
2020/06/29 Python
爱尔兰灯和灯具网上商店:Lights.ie
2018/03/26 全球购物
Cynthia Rowley官网:全球领先的生活方式品牌
2020/10/27 全球购物
给老婆的搞笑检讨书
2014/01/12 职场文书
小学家长会邀请函
2014/01/23 职场文书
高考标语大全
2014/06/05 职场文书
教育实习指导教师评语
2014/12/31 职场文书
2015年财务部工作总结
2015/04/10 职场文书
项目合作意向书
2015/05/08 职场文书
2015人事行政工作总结范文
2015/05/21 职场文书
人代会简报
2015/07/21 职场文书
企业宣传稿范文
2015/07/23 职场文书
2016年度优秀辅导员事迹材料
2016/02/26 职场文书