KMP算法精解及其Python版的代码示例


Posted in Python onJune 01, 2016

KMP算法是经典的字符串匹配算法,解决从字符串S,查找模式字符串M的问题。算法名称来源于发明者Knuth,Morris,Pratt。
假定从字符串S中查找M,S的长度ls,M的长度lm,且(ls > lm)。

朴素的字符串查找方法
从字符串S的第一个字符开始与M进行比较,如果匹配失败。从下一字符开始,重新比较。指导第 (ls - lm) 个字符。
这种方法容易想到并且容易理解,效率不高。
问题在于每次匹配失败后,移动的步伐固定为 1,其实步子可以迈得再大一些。

KMP的字符串查找方法
假定在模式串的连续字串M[0, i] 且 i < lm,已经成功匹配字符串S。但是不巧第 i+1 个字符失败了,怎么办?移动一个字符,重头再来?当然不好,那就是朴素路线了。我们能否从跌倒的地方继续走呢?
既然字串M[0 - i]已经匹配成功,那就从这个子串上做文章。举个栗子     

S序号 j j + 1  j + 2 j + 3 j + 4 j + 5  j+6 j + 7 。。。
S串 a b c a b c d e 。。。
M串 a b c a b d
M序号 0 1 2 3 4 5

此时匹配失败在M串的第5个字符,前4个字符已经匹配成功。
如果从跌倒的地方出发,则需要存在M[0, 4]的子串M[0, k] == S[j+4-k , j+4]。
由于M[0, 4] == S[j ,  j+4] 则有 字串S[j+4-k, j+4] == M[4-k, 4]。综上有M[0, k] == M[4-k, 4]
如果这样的k不存在,那就老老实实的朴素了。
从上面的表格可以直观的看出,下一次匹配只要把M串移动到 j + 3 位置,从 j+5 开始匹配就可以。很容易看出来 在已经匹配成功的字串M[0 , 4]中有最长的子串 (M[0 , 1] == M[3 , 4]),这个就是问题的关键。
因此KMP的核心部分就是计算模式串的各个子串的 k。

实例
首先我们来看一下字符串的朴素匹配.
可以想象成把文本串s固定住,模式串p从s最左边开始对齐,如果对齐的部分完全一样,则匹配成功,失败则将模式串p整体往右移1位,继续检查对齐部分,如此反复.

#朴素匹配 
def naive_match(s, p): 
 m = len(s); n = len(p) 
 for i in range(m-n+1):#起始指针i 
  if s[i:i+n] == p: 
   return True 
 return False

关于kmp算法,讲的最好的当属阮一峰的<字符串匹配的KMP算法>.一路读下来,豁然开朗.
其实就是,对模式串p进行预处理,得到前后缀的部分匹配表,使得我们可以借助已知信息,算出可以右移多少位.即 kmp = 朴素匹配 + 移动多位.
更多细节请看阮一峰的文章,这里就不展开了.
下面给出python的代码实现.

#KMP 
def kmp_match(s, p): 
 m = len(s); n = len(p) 
 cur = 0#起始指针cur 
 table = partial_table(p) 
 while cur<=m-n: 
  for i in range(n): 
   if s[i+cur]!=p[i]: 
    cur += max(i - table[i-1], 1)#有了部分匹配表,我们不只是单纯的1位1位往右移,可以一次移动多位 
    break 
  else: 
   return True 
 return False 
 
#部分匹配表 
def partial_table(p): 
 '''''partial_table("ABCDABD") -> [0, 0, 0, 0, 1, 2, 0]''' 
 prefix = set() 
 postfix = set() 
 ret = [0] 
 for i in range(1,len(p)): 
  prefix.add(p[:i]) 
  postfix = {p[j:i+1] for j in range(1,i+1)} 
  ret.append(len((prefix&postfix or {''}).pop())) 
 return ret 
 
print naive_match("BBC ABCDAB ABCDABCDABDE", "ABCDABD") 
print partial_table("ABCDABD") 
print kmp_match("BBC ABCDAB ABCDABCDABDE", "ABCDABD")

Python 相关文章推荐
Python使用random和tertools模块解一些经典概率问题
Jan 28 Python
python搭建虚拟环境的步骤详解
Sep 27 Python
python中异常捕获方法详解
Mar 03 Python
Python如何实现MySQL实例初始化详解
Nov 06 Python
Python常用爬虫代码总结方便查询
Feb 25 Python
python机器学习库scikit-learn:SVR的基本应用
Jun 26 Python
我们为什么要减少Python中循环的使用
Jul 10 Python
Python random模块制作简易的四位数验证码
Feb 01 Python
python实现的分层随机抽样案例
Feb 25 Python
anaconda3安装及jupyter环境配置全教程
Aug 24 Python
BeautifulSoup中find和find_all的使用详解
Dec 07 Python
selenium框架中driver.close()和driver.quit()关闭浏览器
Dec 08 Python
Python缩进和冒号详解
Jun 01 #Python
Python注释详解
Jun 01 #Python
深入理解python try异常处理机制
Jun 01 #Python
python学习 流程控制语句详解
Jun 01 #Python
python+Django+apache的配置方法详解
Jun 01 #Python
python中函数默认值使用注意点详解
Jun 01 #Python
Python中基础的socket编程实战攻略
Jun 01 #Python
You might like
外媒评选出10支2020年最受欢迎的Dota2战队
2021/03/05 DOTA
Linux系统下使用XHProf和XHGui分析PHP运行性能
2015/12/08 PHP
thinkphp3.2实现在线留言提交验证码功能
2017/07/19 PHP
jQuery技巧总结
2011/01/01 Javascript
jQuery级联操作绑定事件实例
2014/09/02 Javascript
详解JS中Array对象扩展与String对象扩展
2016/01/07 Javascript
javascript获取网页各种高宽及位置的方法总结
2016/07/27 Javascript
js遍历map javaScript遍历map的简单实现
2016/08/26 Javascript
AngularJS学习笔记(三)数据双向绑定的简单实例
2016/11/08 Javascript
微信公众平台开发教程(四) 实例入门:机器人回复(附源码)
2016/12/02 Javascript
Angular下H5上传图片的方法(可多张上传)
2017/01/09 Javascript
Vue.js -- 过滤器使用总结
2017/02/18 Javascript
Angular如何引入第三方库的方法详解
2017/07/13 Javascript
JS+CSS实现网页加载中的动画效果
2017/10/27 Javascript
javascript Function函数理解与实战
2017/12/01 Javascript
Nuxt.js实现校验访问浏览器类型的中间件
2018/08/24 Javascript
vue仿element实现分页器效果
2018/09/13 Javascript
基于three.js实现的3D粒子动效实例代码
2019/04/09 Javascript
vue实现手机号码的校验实例代码(防抖函数的应用场景)
2019/09/05 Javascript
[02:41]辉夜杯现场一家三口 “我爸玩风行 我玩血魔”
2015/12/27 DOTA
[38:54]完美世界DOTA2联赛PWL S2 Rebirth vs LBZS 第一场 11.28
2020/12/01 DOTA
python模拟登录百度贴吧(百度贴吧登录)实例
2013/12/18 Python
Django中模版的子目录与include标签的使用方法
2015/07/16 Python
python之Socket网络编程详解
2016/09/29 Python
Python中super函数用法实例分析
2019/03/18 Python
CSS3与动画有关的属性transition、animation、transform对比(史上最全版)
2017/08/18 HTML / CSS
丝芙兰法国官网:SEPHORA法国
2016/09/01 全球购物
酒店实习个人鉴定
2013/12/07 职场文书
九年级数学教学反思
2014/02/02 职场文书
开服装店计划书
2014/08/15 职场文书
音乐之声音乐广播稿
2014/09/10 职场文书
2014党员干部四风问题对照检查材料思想汇报
2014/09/24 职场文书
2014银行领导班子四风对照检查材料思想汇报
2014/09/25 职场文书
于丹论语心得观后感
2015/06/15 职场文书
养成教育主题班会
2015/08/13 职场文书
教你用Python matplotlib库制作简单的动画
2021/06/11 Python