基于Python爬取fofa网页端数据过程解析


Posted in Python onJuly 13, 2020

FOFA-网络空间安全搜索引擎是网络空间资产检索系统(FOFA)是世界上数据覆盖更完整的IT设备搜索引擎,拥有全球联网IT设备更全的DNA信息。探索全球互联网的资产信息,进行资产及漏洞影响范围分析、应用分布统计、应用流行度态势感知等。

安装环境:

pip install requests
pip install lxml
pip install fire

使用命令:

python fofa.py -s=title="你的关键字" -o="结果输出文件" -c="你的cookie"

代码如下:

import requests,time,base64,fire
from lxml import etree
def fofasc(s,o,c):
  try:
    sbase64 = (base64.b64encode(s.encode('utf-8'))).decode('utf-8')
    cookies = {
      "_fofapro_ars_session": c
    }
 
    headers = {
      'User-Agent': 'Mozilla/5.0 (Linux; Android 7.1.2; PCRT00 Build/N2G48H; wv) AppleWebKit/537.36 (KHTML, like Gecko) Version/4.0 Chrome/66.0.3359.158 Safari/537.36 fanwe_app_sdk sdk_type/android sdk_version_name/4.0.1 sdk_version/2020042901 screen_width/720 screen_height/1280',
    }
    for i in range(1,1000):
      url = "https://www.fofa.so/result?q="+s+"&qbase64="+sbase64+"&full=true&page="+str(i)
      r = requests.get(url, headers=headers, cookies=cookies)
      soup = etree.HTML(r.text)
      result = soup.xpath('//*[@id="ajax_content"]/div/div/div/a/text()')
      print(result)
      if result != []:
        for rs in result:
          with open(o,mode="a+") as f:
            f.write(rs+"\n")
      else:
        print("已经获取不到任何数据,爬取完毕!")
        break
      time.sleep(2)
  except KeyboardInterrupt:
    print('用户退出')
if __name__ == '__main__':
  fire.Fire(fofasc)

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python里对list中的整数求平均并排序
Sep 12 Python
在Python的Flask框架中实现全文搜索功能
Apr 20 Python
Python实现身份证号码解析
Sep 01 Python
windows下安装Python和pip终极图文教程
Mar 05 Python
Python中进程和线程的区别详解
Oct 29 Python
python监控键盘输入实例代码
Feb 09 Python
python3 map函数和filter函数详解
Aug 26 Python
django-rest-swagger对API接口注释的方法
Aug 29 Python
使用 PyTorch 实现 MLP 并在 MNIST 数据集上验证方式
Jan 08 Python
python实现吃苹果小游戏
Mar 21 Python
Django用内置方法实现简单搜索功能的方法
Dec 18 Python
pandas统计重复值次数的方法实现
Feb 20 Python
python利用os模块编写文件复制功能——copy()函数用法
Jul 13 #Python
python 制作python包,封装成可用模块教程
Jul 13 #Python
通过Python实现Payload分离免杀过程详解
Jul 13 #Python
python上selenium的弹框操作实现
Jul 13 #Python
python如何导入依赖包
Jul 13 #Python
python入门:argparse浅析 nargs='+'作用
Jul 12 #Python
浅谈Python 命令行参数argparse写入图片路径操作
Jul 12 #Python
You might like
比较简单实用的PHP无限分类源码分享(思路不错)
2011/10/13 PHP
如何让动态插入的javascript脚本代码跑起来。
2007/01/09 Javascript
使用js获取QueryString的方法小结
2010/02/28 Javascript
CSS和JS标签style属性对照表(方便js开发的朋友)
2010/11/11 Javascript
网页中返回顶部代码(多种方法)另附注释说明
2013/04/24 Javascript
js中如何复制一个对象并获取其所有属性和属性对应的值
2013/10/24 Javascript
jquery slibings选取同级其他元素的实现代码
2013/11/15 Javascript
jquery操作cookie插件分享
2014/01/14 Javascript
JavaScript中创建字典对象(dictionary)实例
2015/03/31 Javascript
简介JavaScript中的push()方法的使用
2015/06/09 Javascript
jquery实现左右轮播图效果
2017/09/28 jQuery
解决vue的变量在settimeout内部效果失效的问题
2018/08/30 Javascript
jQuery实现手风琴效果(蒙版)
2020/01/11 jQuery
在Python的setuptools框架下生成egg的教程
2015/04/13 Python
在Django中编写模版节点及注册标签的方法
2015/07/20 Python
Python编程深度学习计算库之numpy
2018/12/28 Python
python使用requests模块实现爬取电影天堂最新电影信息
2019/04/03 Python
Python中将两个或多个list合成一个list的方法小结
2019/05/12 Python
python获取Linux发行版名称
2019/08/30 Python
python tkinter组件使用详解
2019/09/16 Python
Django框架教程之中间件MiddleWare浅析
2019/12/29 Python
python 异步async库的使用说明
2020/05/04 Python
css3 实现滚动条美化效果的实例代码
2021/01/06 HTML / CSS
html5 div布局与table布局详解
2016/11/16 HTML / CSS
应届毕业生求职信范文分享
2013/12/26 职场文书
校园学雷锋活动月总结
2014/03/09 职场文书
《桂花雨》教学反思
2014/04/12 职场文书
抗震救灾标语
2014/06/26 职场文书
明星员工获奖感言
2014/08/14 职场文书
干部对照检查材料范文
2014/08/26 职场文书
元旦晚会主持词开场白
2015/05/28 职场文书
婚宴主持词
2015/06/30 职场文书
团结友爱主题班会
2015/08/13 职场文书
检举信的写法
2019/04/10 职场文书
十大冰系宝可梦排名,颜值最高的阿罗拉九尾,第三使用率第一
2022/03/18 日漫
Win11 Beta 22621.601 和 22622.601今日发布 KB5017384修复内容汇总
2022/09/23 数码科技