Python实现的生成自我描述脚本分享(很有意思的程序)


Posted in Python onJuly 18, 2014

自我描述的语句指这样一种语句:它的内容就是对它本身的描述。(废话……)比如下面这句句子:

这是一段自我描述的语句,除了标点符号外,它共包含125个字符,其中33个“个”,29个“2”,5个“3”,3个“符”,3个“5”,2个“一”,2个“它”,2个“包”,2个“的”,2个“标”,2个“了”,2个“我”,2个“外”,2个“含”,2个“中”,2个“是”,2个“1”,2个“段”,2个“点”,2个“描”,2个“9”,2个“字”,2个“这”,2个“句”,2个“除”,2个“自”,2个“语”,2个“共”,2个“述”,2个“号”,2个“其”。

这句话是我用一段 Python 脚本生成的,生成原理大致如下:

1、给出一个模板,让句子的各个内容知道自己该出现在哪个部位;
2、根据当前信息,生成句子;
3、将当前句子作为输入,再次执行第 2 步的操作;
4、直到句子各部分内容的信息都正确。

简单来说,就是一个不断迭代修正的过程。

其中需要注意的是,每次迭代时应该尽量只改动一个地方,以免两处同时变化相互影响,造成死循环;另外,如果句子中有多处地方需要修正,尽量随机选取一处进行修正,而不要按一定顺序进行修正,同样是为了减少陷入死循环的风险。

不过,即使如此,某些情况下还是有可能陷入死循环,比如如果某一步得到了下面这样的句子:

这句很 2 的话包含 3 个“2”。

上面这句话明显是错误的,因为其中只有两个“2”。那么,我们把那个“3”改为“2”,是不是就对了呢?很容易发现,如果我们做了这样的改动之后,句子将变成:

这句很 2 的话包含 2 个“2”。

这时,句子中又包含三个“2”了。像这样的句子就似乎无法简单地改为正确的自我描述语句,因为无论如何改都会陷入死循环。

最后,我用来生成最上面的那句自我描述语句的 Python 脚本如下:

# -*- coding: utf-8 -*-

import random

class SelfDesc(object):

  ignore_chars = u",。“”"

  def __init__(self, template):

    self.template = template
    self.length = 0
    self.detail = ""
    self.content = ""
    self.chars = ""
    self.char_count = {}
    self.makeContent()
    self.char_count = self.getCharCount()
    self.getCharCount()
    self.makeContent()


  def __str__(self):

    return self.content


  def makeContent(self):

    self.makeDetail()
    self.content = self.template.replace(u"{length}", u"%d" % self.length)
      .replace(u"{detail}", self.detail)
    self.getChars()


  def getChars(self):

    chars = self.content
    for c in self.ignore_chars:
      chars = chars.replace(c, "")

    self.chars = chars
    return chars


  def getLength(self):

    self.length = len(self.chars)


  def getCharCount(self):

    d = {}
    for c in self.chars:
      if c in self.ignore_chars:
        continue
      d.setdefault(c, 0)
      d[c] += 1

    return d


  def makeDetail(self):

    d = self.char_count
    items = d.items()
    items.sort(key=lambda x: -x[1])

    s = []
    for c, n in items:
      s.append(u"%d个“%s”" % (n, c))

    self.detail = u",".join(s)


  def correct(self):

    print "-" * 50

    char_count = self.getCharCount()
    items = char_count.items()
    random.shuffle(items)
    for c, n in items:
      if n <= 1 and c in self.char_count:
        del self.char_count[c]
        continue

      if self.char_count.get(c) == n:
        continue
      else:
        self.char_count[c] = n
        return True

    else:
      len = self.length
      self.getLength()

      if len != self.length:
        return True

    return False


  def generate(self):

    icount = 0
    while self.correct():
      icount += 1
      self.makeContent()
      print u"#%d %s" % (icount, self)


def main():

  template = u"这是一段自我描述的语句,除了标点符号外,它共包含{length}个字符,其中{detail}。"
  sd = SelfDesc(template)
  sd.generate()
  print u"%s" % sd


if __name__ == "__main__":
  main()
Python 相关文章推荐
解决uWSGI的编码问题详解
Mar 24 Python
解决python报错MemoryError的问题
Jun 26 Python
Python延时操作实现方法示例
Aug 14 Python
Python并行分布式框架Celery详解
Oct 15 Python
python正则表达式匹配[]中间为任意字符的实例
Dec 25 Python
python 检查是否为中文字符串的方法
Dec 28 Python
python中aioysql(异步操作MySQL)的方法
Apr 11 Python
Python利用PyPDF2库获取PDF文件总页码实例
Apr 03 Python
Python实现常见的几种加密算法(MD5,SHA-1,HMAC,DES/AES,RSA和ECC)
May 09 Python
Python中读取文件名中的数字的实例详解
Dec 25 Python
python使用Windows的wmic命令监控文件运行状况,如有异常发送邮件报警
Jan 30 Python
python线程优先级队列知识点总结
Feb 28 Python
Python中使用 Selenium 实现网页截图实例
Jul 18 #Python
Python中使用PyHook监听鼠标和键盘事件实例
Jul 18 #Python
python中使用pyhook实现键盘监控的例子
Jul 18 #Python
python使用pyhook监控键盘并实现切换歌曲的功能
Jul 18 #Python
python中使用百度音乐搜索的api下载指定歌曲的lrc歌词
Jul 18 #Python
python采集博客中上传的QQ截图文件
Jul 18 #Python
Python下singleton模式的实现方法
Jul 16 #Python
You might like
基于mysql的论坛(6)
2006/10/09 PHP
PHP 数据库树的遍历方法
2009/02/06 PHP
php获取url字符串截取路径的文件名和扩展名的函数
2010/01/22 PHP
Smarty foreach控制循环次数的一些方法
2015/07/01 PHP
PHP实现四种基础排序算法的运行时间比较(推荐)
2016/08/11 PHP
HTML中Select不用Disabled实现ReadOnly的效果
2008/04/07 Javascript
jquery.ui.draggable中文文档
2009/11/24 Javascript
30个精美的jQuery幻灯片效果插件和教程
2011/08/23 Javascript
javascript背景时钟实现方法
2015/06/18 Javascript
JavaScript包装对象使用详解
2015/07/09 Javascript
一道常被人轻视的web前端常见面试题(JS)
2016/02/15 Javascript
深入理解JS继承和原型链的问题
2016/12/17 Javascript
JS正则匹配URL网址的方法(可匹配www,http开头的一切网址)
2017/01/06 Javascript
简单实现bootstrap导航效果
2017/02/07 Javascript
ES6下React组件的写法示例代码
2017/05/04 Javascript
vue.js,ajax渲染页面的实例
2018/02/11 Javascript
解决vue2中使用axios http请求出现的问题
2018/03/05 Javascript
让你5分钟掌握9个JavaScript小技巧
2018/06/09 Javascript
node.JS二进制操作模块buffer对象使用方法详解
2020/02/06 Javascript
[01:11:46]DOTA2-DPC中国联赛 正赛 iG vs Magma BO3 第一场 2月23日
2021/03/11 DOTA
python实现的生成随机迷宫算法核心代码分享(含游戏完整代码)
2014/07/11 Python
Python中用函数作为返回值和实现闭包的教程
2015/04/27 Python
python 调用HBase的简单实例
2016/12/18 Python
Python编程中flask的简介与简单使用
2018/12/28 Python
python导入模块交叉引用的方法
2019/01/19 Python
谈谈Python中的while循环语句
2019/03/10 Python
Python学习笔记之字符串和字符串方法实例详解
2019/08/22 Python
django 连接数据库出现1045错误的解决方式
2020/05/14 Python
Python bisect模块原理及常见实例
2020/06/17 Python
css实例教程 一款纯css3实现的超炫动画背画特效
2014/11/05 HTML / CSS
工厂实习感言
2014/01/14 职场文书
宗教学大学生职业生涯规划范文
2014/02/08 职场文书
超市创业计划书
2014/04/24 职场文书
公司法人授权委托书范本
2014/09/12 职场文书
后进基层党组织整改方案
2014/10/25 职场文书
五一劳动节活动总结
2015/02/09 职场文书