Python实现一个转存纯真IP数据库的脚本分享


Posted in Python onMay 21, 2017

前言

之前写过很多关于扫描脚本的文章,一直都没写自己的扫描IP段是哪里搞来的,也会有朋友经常来问一些扫描经验,说实话我觉得这个工具并没有实际的技术含量,但是能提高工作效率,就共享出来给大家耍耍~

谈到扫描经验,我个人通常都会针对不同的设备,不同的应用选择不同类型的段。

比如我现在扫描的目标是一款电信光猫,那自然是选择电信的IP段,光猫一般是家庭用户,我们筛选下家庭用户的活跃IP段,这样我们就有针对性了。

再比如我现在想扫一款企业路由设备,那么我就可以选择企业公司多的段。

纯真IP真心是个不错的工具,我通常用来检索某个地区的IP段,但是这个工具有个非常致命的缺点,就是不能联合查询,这就令人非常蛋疼了,而且这玩意每次用都要切换到win下面操作,对于我这种Linux党来说自然是无法忍,索性写个把纯真IP转存到mysql数据库的脚本,这样不用每次查询都去win下面,还可以直接部署到远程,查询方便了很多,最主要的还是支持多条件查询。

需求

Python写这个脚本技术上难度不大,主要还是用到了MySQLdb库,关于MySQLdb库的安装就不多说了,博客之前有写相关的文章。这里咱们需要先分析下纯真IP数据库的数据文件结构,发现其实每一行的结构都是固定的,那么写起来就简单了。

编码这块我就不详细说了,简单几个方法就能轻松实现,贴出来代码

#!/usr/bin/env python
# coding=utf-8
# kbdancer@92ez.com

import MySQLdb
import sys

reload(sys)
sys.setdefaultencoding('utf8')


def save_data_to_mysql(mysql_object, ip_line):
 try:
  begin = ip_line[0:16].replace(' ', '')
  end = ip_line[16:32].replace(' ', '')
  try:
   location = line[32:].split(' ')[0]
  except:
   location = ''
  try:
   isp_type = line[32:].replace(' ', ' ').split(' ')[1].replace('\n', '').replace('\r', '')
  except:
   isp_type = ''

  this_line_value = [begin + "-" + end, location, isp_type]
  do_insert(mysql_object, this_line_value)
 except Exception, e:
  print e


def do_insert(mysql_object, row_data):
 try:
  insert_sql = """INSERT INTO `ipdb` (`iprange`,`location`, `type`) VALUES ( %s, %s, %s )"""
  mysql_object.insert(insert_sql, row_data)
 except Exception, e:
  print row_data
  print e


class Database:
 host = 'localhost'
 user = 'ipdb'
 password = '3u9whrpcEUBTnNNn'
 db = 'ipinfo'
 charset = 'utf8'

 def __init__(self):
  self.connection = MySQLdb.connect(self.host, self.user, self.password, self.db, charset=self.charset)
  self.cursor = self.connection.cursor()

 def insert(self, query, params):
  try:
   self.cursor.execute(query, params)
   self.connection.commit()
  except Exception, e:
   print e
   self.connection.rollback()

 def query(self, query, params):
  cursor = self.connection.cursor(MySQLdb.cursors.DictCursor)
  cursor.execute(query, params)
  return cursor.fetchall()

 def __del__(self):
  self.connection.close()


if __name__ == '__main__':
 mysql = Database()
 ip_file = open(sys.path[0] + "/ip.txt")
 print 'Start save to mysql ...'
 for line in ip_file:
  save_data_to_mysql(mysql, line)
 ip_file.close()
 print 'Save complete.'

注意

这里存在一个性能问题,就是遍历所有数据的时候需要进行插入数据库的操作,单行插入的效率是非常低的,建议使用多行插入,比如说写个缓存数组,当缓存数组达到规定的条数,比如达到100条的时候,一次性把100条存入到数据库,这个速度比单条存入要快得多。博主我在这里就挖个坑,希望使用脚本的朋友能自己修改,改起来也不难。

由于纯真IP数据库导出的txt文件并不是标准的无BOM UTF8编码,直接解析肯定是失败的,建议使用Notepad++先转码一下

效果

原始数据

Python实现一个转存纯真IP数据库的脚本分享

转存之后的数据

Python实现一个转存纯真IP数据库的脚本分享

使用

首先需要导出纯真ip数据库为txt文档,这里我导出为ip.txt

然后放到Py脚本同一目录

对了,首先你还得有mysql数据库

然后导入数据库结构,就是那个sql文件

接着你还得修改脚本里面的mysql连接密码等

最后执行Py脚本就好了

说明

所有代码都托管在Github

地址 https://github.com/kbdancer/myTools/tree/master/czip2mysql

总结

以上就是这篇文章的全部内容了,希望本文的内容对大家的学习或者工作能带来一定的帮助,如果有疑问大家可以留言交流,谢谢大家对三水点靠木的支持。

Python 相关文章推荐
python选择排序算法的实现代码
Nov 21 Python
python获取糗百图片代码实例
Dec 18 Python
python获取元素在数组中索引号的方法
Jul 15 Python
使用apidocJs快速生成在线文档的实例讲解
Feb 07 Python
Python2.7 实现引入自己写的类方法
Apr 29 Python
pandas分别写入excel的不同sheet方法
Dec 11 Python
Python使用扩展库pywin32实现批量文档打印实例
Apr 09 Python
解决reload(sys)后print失效的问题
Apr 25 Python
Python matplotlib 绘制双Y轴曲线图的示例代码
Jun 12 Python
Python 捕获代码中所有异常的方法
Aug 03 Python
Pytorch中使用ImageFolder读取数据集时忽略特定文件
Mar 23 Python
python 单机五子棋对战游戏
Apr 28 Python
Python学习小技巧之利用字典的默认行为
May 20 #Python
Python学习小技巧之列表项的排序
May 20 #Python
Python学习小技巧之列表项的推导式与过滤操作
May 20 #Python
Python yield 使用方法浅析
May 20 #Python
Python学习小技巧之列表项的拼接
May 20 #Python
Django验证码的生成与使用示例
May 20 #Python
Linux RedHat下安装Python2.7开发环境
May 20 #Python
You might like
根德Grundig S400/S500/S700电路分析
2021/03/02 无线电
关于访问控制的一首PHP面试题(对属性或方法的访问控制)
2012/09/13 PHP
利用PHP实现短域名互转
2013/07/05 PHP
PHP时间戳 strtotime()使用方法和技巧
2013/10/29 PHP
PHP中批量生成静态html(命令行下运行PHP)
2014/04/19 PHP
PHP中常用的字符串格式化函数总结
2014/11/19 PHP
PHP实现微信提现功能(微信商城)
2019/11/21 PHP
tp5.1 框架join方法用法实例分析
2020/05/26 PHP
Avengerls vs Newbee BO3 第二场2.18
2021/03/10 DOTA
ExtJS 2.2.1的grid控件在ie6中的显示问题
2009/05/04 Javascript
javascript arguments 传递给函数的隐含参数
2009/08/21 Javascript
js string 转 int 注意的问题小结
2013/08/15 Javascript
jQuery 1.9使用$.support替代$.browser的使用方法
2014/05/27 Javascript
JavaScript实现的一个倒计时的类
2015/03/12 Javascript
javascript制作的简单注册模块表单验证
2015/04/13 Javascript
详解JavaScript的回调函数
2015/11/20 Javascript
js实现搜索框关键字智能匹配代码
2020/03/26 Javascript
Angular-Ui-Router+ocLazyLoad动态加载脚本示例
2017/03/02 Javascript
基于JavaScript实现前端数据多条件筛选功能
2020/08/19 Javascript
Vue中使用vee-validate表单验证的方法
2018/05/09 Javascript
vue使用exif获取图片经纬度的示例代码
2020/12/11 Vue.js
Vue SPA 首屏优化方案
2021/02/26 Vue.js
[27:53]2014 DOTA2华西杯精英邀请赛 5 24 NewBee VS iG
2014/05/26 DOTA
Python迭代器和生成器介绍
2015/03/06 Python
python制作websocket服务器实例分享
2016/11/20 Python
Python实现矩阵相乘的三种方法小结
2018/07/26 Python
Python-opencv 双线性插值实例
2020/01/17 Python
从Pytorch模型pth文件中读取参数成numpy矩阵的操作
2021/03/04 Python
css3实现的多级渐变下拉菜单导航效果代码
2015/08/31 HTML / CSS
美国护肤咨询及美容产品电商:Askderm
2017/02/24 全球购物
学生处主任岗位职责
2013/12/01 职场文书
酒店个人培训自我鉴定
2013/12/11 职场文书
淘宝网店营销策划书
2014/01/11 职场文书
计算机专业毕业生求职信
2014/04/30 职场文书
授权委托书(法人单位用)
2014/09/29 职场文书
朋友聚会开场白
2015/06/01 职场文书