基于Python爬取fofa网页端数据过程解析


Posted in Python onJuly 13, 2020

FOFA-网络空间安全搜索引擎是网络空间资产检索系统(FOFA)是世界上数据覆盖更完整的IT设备搜索引擎,拥有全球联网IT设备更全的DNA信息。探索全球互联网的资产信息,进行资产及漏洞影响范围分析、应用分布统计、应用流行度态势感知等。

安装环境:

pip install requests
pip install lxml
pip install fire

使用命令:

python fofa.py -s=title="你的关键字" -o="结果输出文件" -c="你的cookie"

代码如下:

import requests,time,base64,fire
from lxml import etree
def fofasc(s,o,c):
  try:
    sbase64 = (base64.b64encode(s.encode('utf-8'))).decode('utf-8')
    cookies = {
      "_fofapro_ars_session": c
    }
 
    headers = {
      'User-Agent': 'Mozilla/5.0 (Linux; Android 7.1.2; PCRT00 Build/N2G48H; wv) AppleWebKit/537.36 (KHTML, like Gecko) Version/4.0 Chrome/66.0.3359.158 Safari/537.36 fanwe_app_sdk sdk_type/android sdk_version_name/4.0.1 sdk_version/2020042901 screen_width/720 screen_height/1280',
    }
    for i in range(1,1000):
      url = "https://www.fofa.so/result?q="+s+"&qbase64="+sbase64+"&full=true&page="+str(i)
      r = requests.get(url, headers=headers, cookies=cookies)
      soup = etree.HTML(r.text)
      result = soup.xpath('//*[@id="ajax_content"]/div/div/div/a/text()')
      print(result)
      if result != []:
        for rs in result:
          with open(o,mode="a+") as f:
            f.write(rs+"\n")
      else:
        print("已经获取不到任何数据,爬取完毕!")
        break
      time.sleep(2)
  except KeyboardInterrupt:
    print('用户退出')
if __name__ == '__main__':
  fire.Fire(fofasc)

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python群发邮件实例代码
Jan 03 Python
Python深入学习之上下文管理器
Aug 31 Python
独特的python循环语句
Nov 20 Python
PyCharm 常用快捷键和设置方法
Dec 20 Python
Python实现字典(dict)的迭代操作示例
Jun 05 Python
使用Python实现从各个子文件夹中复制指定文件的方法
Oct 25 Python
pycharm 取消默认的右击运行unittest的方法
Nov 29 Python
解决新django中的path不能使用正则表达式的问题
Dec 18 Python
Python 调用PIL库失败的解决方法
Jan 08 Python
Mac在python3环境下安装virtualwrapper遇到的问题及解决方法
Jul 09 Python
详解Django配置JWT认证方式
May 09 Python
浅谈pymysql查询语句中带有in时传递参数的问题
Jun 05 Python
python利用os模块编写文件复制功能——copy()函数用法
Jul 13 #Python
python 制作python包,封装成可用模块教程
Jul 13 #Python
通过Python实现Payload分离免杀过程详解
Jul 13 #Python
python上selenium的弹框操作实现
Jul 13 #Python
python如何导入依赖包
Jul 13 #Python
python入门:argparse浅析 nargs='+'作用
Jul 12 #Python
浅谈Python 命令行参数argparse写入图片路径操作
Jul 12 #Python
You might like
php网页后退不再出现过期
2007/03/08 PHP
php产生随机数的两种方法实例代码 输出随机IP
2011/04/08 PHP
PHP使用pcntl_fork实现多进程下载图片的方法
2014/12/16 PHP
Zend Framework路由器用法实例详解
2016/12/11 PHP
PHP中类与对象功能、用法实例解读
2020/03/27 PHP
jQuery.query.js 取参数的两点问题分析
2012/08/06 Javascript
页面实时更新时间的JS实例代码
2013/12/18 Javascript
Css3制作变形与动画效果
2015/07/24 Javascript
javascript实现添加附件功能的方法
2015/11/18 Javascript
jquery实用技巧之输入框提示语句
2016/07/28 Javascript
使用Webpack提高Vue.js应用的方式汇总(四种)
2017/07/10 Javascript
JavaScript进阶(四)原型与原型链用法实例分析
2020/05/09 Javascript
[02:47]DOTA2英雄基础教程 野性怒吼兽王
2013/12/05 DOTA
[01:58]DOTA2上海特级锦标赛现场采访:RTZ这个ID到底好不好
2016/03/25 DOTA
python的urllib模块显示下载进度示例
2014/01/17 Python
Python模拟登陆实现代码
2017/06/14 Python
python 中split 和 strip的实例详解
2017/07/12 Python
pyqt5实现俄罗斯方块游戏
2019/01/11 Python
python字典嵌套字典的情况下找到某个key的value详解
2019/07/10 Python
Python math库 ln(x)运算的实现及原理
2019/07/17 Python
python3多线程知识点总结
2019/09/26 Python
Python3实现监控新型冠状病毒肺炎疫情的示例代码
2020/02/13 Python
python中安装django模块的方法
2020/03/12 Python
Python新手如何进行闭包时绑定变量操作
2020/05/29 Python
html5实现多图片预览上传及点击可拖拽控件
2018/03/15 HTML / CSS
Farfetch美国:奢侈品牌时尚购物平台
2019/05/02 全球购物
Intersport西班牙:在线体育商店
2019/11/06 全球购物
一些.net面试题
2014/10/06 面试题
高中英语演讲稿范文
2014/04/24 职场文书
关于十八大的演讲稿
2014/09/15 职场文书
工作散漫检讨书
2014/09/16 职场文书
幸福家庭事迹材料
2014/12/20 职场文书
2015年幼儿园教研活动总结
2015/03/25 职场文书
创业方案:赚钱的烧烤店该怎样做?
2019/07/05 职场文书
超级实用!五步法则,教你写好年终工作总结
2019/12/05 职场文书
Angular性能优化之第三方组件和懒加载技术
2021/05/10 Javascript