python 域名分析工具实现代码


Posted in Python onJuly 15, 2009

代码如下:

import sys, urllib 
import datetime,time 
def getDate(): 
strday=datetime.datetime.now().__str__() 
strday=strday.split()[0] 
return strday 
#url = "http://www.kingnic.com/list/2009-06-16.txt" 
def getUrl(dateStr=None): 
baseUrl ="http://www.kingnic.com/list/" 
if dateStr: 
return baseUrl+dateStr+".txt" 
thisDate = getDate(); 
if not thisDate: 
print "Error Date!" 
return None; 
url = baseUrl+thisDate+".txt" 
return url 
def getSource(url): 
source = urllib.urlopen(url).read() 
return source def save(source,filename="domains.txt"): 
fp = open(filename,"w") 
fp.write(source) 
fp.close() 
return True; 
def loadList(fileName="domains.txt"): 
fp = open("domains.txt","r") 
source = fp.readlines() 
fp.close() 
return source; 
def getPrefix(domain): 
return domain.split('.')[0] 
def getPostfix(domain): 
return domain.split('.')[1] 
def hasMidLine(domain): 
if '-' in domain: 
return True 
else: 
return False 
def parser(domains): 
max =4 
min =0 
keyword =('sky','see','job') 
result=[] 
len_num =0; 
mid_line_num =0; 
for domain in domains: 
prefix = getPrefix(domain) 
postfix = getPostfix(domain) 
domainlen = len(prefix) 
if (domainlen < min) or (domainlen > max): 
len_num +=1 
continue 
if hasMidLine(prefix): 
mid_line_num +=1 
continue 
result.append(domain) 
print " log : \n" 
print "all: \t",len(domains) 
print "len not in [%s,%s] \t: %s"%(max,min,len_num) 
print "contain '-' :\t",mid_line_num 
print "remain:\t",len(result) 
return result; 
if __name__ == "__main__": 
url = getUrl() 
source = getSource(url) 
save(source) 
domains =loadList() 
result = parser(domains) 
save("".join(result),"result.txt") 
print("\n\n\nfinished!!")

输出文件:
domains.txt : kingnic.com 据当天释放的 域名;
result.txt    : 符合过滤条件的域名;
log输出:
all: 55500 
len not in [4,0] : 55019 
contain '-' : 32 
remain: 449 
finished!!

对 后缀、长度和有无“-”过滤,过滤条件有点少,其它以后如有需要再加。
Python 相关文章推荐
vc6编写python扩展的方法分享
Jan 17 Python
跟老齐学Python之做一个小游戏
Sep 28 Python
使用Python3制作TCP端口扫描器
Apr 17 Python
解决Matplotlib图表不能在Pycharm中显示的问题
May 24 Python
解决pycharm运行出错,代码正确结果不显示的问题
Nov 30 Python
Python自动化之数据驱动让你的脚本简洁10倍【推荐】
Jun 04 Python
简单了解python关系(比较)运算符
Jul 08 Python
python之pexpect实现自动交互的例子
Jul 25 Python
TensorFlow 多元函数的极值实例
Feb 10 Python
pytorch进行上采样的种类实例
Feb 18 Python
python如何求圆的面积
Jul 01 Python
Python修改DBF文件指定列
Dec 19 Python
python 自动提交和抓取网页
Jul 13 #Python
python self,cls,decorator的理解
Jul 13 #Python
python 解析html之BeautifulSoup
Jul 07 #Python
打印出python 当前全局变量和入口参数的所有属性
Jul 01 #Python
python 查找文件夹下所有文件 实现代码
Jul 01 #Python
python 运算符 供重载参考
Jun 11 #Python
python getopt 参数处理小示例
Jun 09 #Python
You might like
windows8.1下Apache+Php+MySQL配置步骤
2015/10/30 PHP
php+js实现倒计时功能
2014/06/02 Javascript
JavaScript判断textarea值是否为空并给出相应提示
2014/09/04 Javascript
AngularJS基础学习笔记之控制器
2015/05/10 Javascript
jQuery的position()方法详解
2015/07/19 Javascript
JavaScript多并发问题如何处理
2015/10/28 Javascript
基于BootStrap Metronic开发框架经验小结【二】列表分页处理和插件JSTree的使用
2016/05/12 Javascript
bootstrap布局中input输入框右侧图标点击功能
2016/05/16 Javascript
深入理解JavaScript中的浮点数
2016/05/18 Javascript
全面解析Bootstrap中scrollspy(滚动监听)的使用方法
2016/06/06 Javascript
javascript实现的全国省市县无刷新多级关联菜单效果代码
2016/08/01 Javascript
JavaScript仿微博输入框效果(案例分析)
2016/12/06 Javascript
jQuery UI制作选项卡(tabs)
2016/12/13 Javascript
JavaScript适配器模式详解
2017/10/19 Javascript
Js经典案例的实例代码
2018/05/10 Javascript
微信小程序使用component自定义toast弹窗效果
2018/11/27 Javascript
vue 自动化路由实现代码
2019/09/03 Javascript
layui给下拉框、按钮状态、时间赋初始值的方法
2019/09/10 Javascript
[01:00:26]Ti4主赛事胜者组第一天 EG vs NEWBEE 1
2014/07/19 DOTA
[01:04:31]DOTA2-DPC中国联赛定级赛 iG vs Magma BO3第二场 1月8日
2021/03/11 DOTA
在Python中编写数据库模块的教程
2015/04/29 Python
python 与GO中操作slice,list的方式实例代码
2017/03/20 Python
Python正则表达式常用函数总结
2017/06/24 Python
jupyter notebook引用from pyecharts.charts import Bar运行报错
2020/04/23 Python
python 监听salt job状态,并任务数据推送到redis中的方法
2019/01/14 Python
python利用Opencv实现人脸识别功能
2019/04/25 Python
python内存管理机制原理详解
2019/08/12 Python
python单例模式原理与创建方法实例分析
2019/10/26 Python
Debenhams爱尔兰:英国知名的百货公司
2017/01/02 全球购物
卡西欧B级产品官方网站:Casio Outlet
2018/05/22 全球购物
会计电算化个人自我评价
2013/11/17 职场文书
师范学院教师自荐书
2014/01/31 职场文书
《湘夫人》教学反思
2014/02/21 职场文书
2015年政府采购工作总结
2015/05/21 职场文书
幼儿园开学家长寄语(2016春季)
2015/12/03 职场文书
Python实战之疫苗研发情况可视化
2021/05/18 Python