使用Python AIML搭建聊天机器人的方法示例


Posted in Python onJuly 09, 2018

AIML全名为Artificial Intelligence Markup Language(人工智能标记语言),是一种创建自然语言软件代理的XML语言,是由RichardS. Wallace 博士和Alicebot开源软件组织于1995-2000年间发明创造的。AIML是一种为了匹配模式和确定响应而进行规则定义的 XML 格式。

AIML的设计目标如下:

  1. AIML应当为大众所易学易会。
  2. AIML应当使最小的概念得以编码使之基于L.I.C.E支持一种刺激-响应学科系统组件。
  3. AIML应当兼容XML。
  4. 书写AIML可处理程序文件应当简单便捷。
  5. AIML对象应当对人而言具有良好的可读性和清晰度。
  6. AIML的设计应当正式而简洁。
  7. AIML应当包含对其他语言的依附性。

关于AIML详细的初级读物,可翻阅Alice Bot's AIML Primer。你同样可以在AIML Wikipedia page了解更多 AIML 的内容以及它能够做什么。借助 Python 的 AIML 包,我们很容易实现人工智能聊天机器人。

1、安装Python aiml库

pip install aiml

2、获取alice资源

Python aiml安装完成后在Python安装目录下的 Lib/site-packages/aiml下会有alice子目录,这个是系统自带的一个简单的语料库。

3、Python下加载alice

取得alice资源之后就可以直接利用Python aiml库加载alice brain了。

# -*- coding: utf-8 -*-
import aiml
import sys
import os
 
 
def get_module_dir(name):
  path = getattr(sys.modules[name], '__file__', None)
  if not path:
    raise AttributeError('module %s has not attribute __file__' % name)
  return os.path.dirname(os.path.abspath(path))
 
 
alice_path = get_module_dir('aiml') + '/alice'
#切换到语料库所在工作目录
os.chdir(alice_path)
 
alice = aiml.Kernel()
alice.learn("startup.xml")
alice.respond('LOAD ALICE')
 
while True:
print alice.respond(raw_input("Enter your message >> "))

上述流程非常的简单,接下来我们要自己从0开始创建自己的机器人。

创建标准启动文件

标准的做法是,创建一个名为std-startup.xml的启动文件,作为加载AIML文件的主入口点。在这个例子中,我们将创建一个基础的文件,它匹配一个模式,并且返回一个相应。我们想要匹配模式load aiml b,然后让它加载我们的aiml大脑作为响应。我们将在一步内创建basic_chat.aiml文件。

<aiml version="1.0.1" encoding="UTF-8">
  <!-- std-startup.xml -->
 
  <!-- Category是一个自动的AIML单元 -->
  <category>
 
    <!-- Pattern用来匹配用户输入 -->
    <!-- 如果用户输入 "LOAD AIML B" -->
    <pattern>LOAD AIML B</pattern>
 
    <!-- Template是模式的响应 -->
    <!-- 这里学习一个aiml文件 -->
    <template>
      <learn>basic_chat.aiml</learn>
      <!-- 你可以在这里添加更多的aiml文件 -->
      <!--<learn>more_aiml.aiml</learn>-->
    </template>
 
  </category>
 
</aiml>

创建一个AIML文件

在上面,我们创建的AIML文件只能处理一个模式:load aiml b。当我们向机器人输入那个命令时,它将会尝试加载basic_chat.aiml。除非我们真的创建了它,否则无效。下面是你可以写进basic_chat.aiml的内容。我们将匹配两个基本的模式和响应。

<aiml version="1.0.1" encoding="UTF-8">
<!-- basic_chat.aiml -->
<aiml>
 
  <category>
    <pattern>HELLO</pattern>
    <template>
      Well, hello!
    </template>
  </category>
 
  <category>
    <pattern>WHAT ARE YOU</pattern>
    <template>
      I'm a bot, silly!
    </template>
  </category>
 
</aiml>

随机响应

你也可以像下面这样添加随机响应。它将在接受到一个以”One time I”开头的消息的时候随机响应。*是一个匹配任何东西的通配符。

<category>
    <pattern>ONE TIME I *</pattern>
    <template>
      <random>
        <li>Go on.</li>
        <li>How old are you?</li>
        <li>Be more specific.</li>
        <li>I did not know that.</li>
        <li>Are you telling the truth?</li>
        <li>I don't know what that means.</li>
        <li>Try to tell me that another way.</li>
        <li>Are you talking about an animal, vegetable or mineral?</li>
        <li>What is it?</li>
      </random>
    </template>
  </category>

使用已存在的AIML文件

编写你自己的AIML文件是一个很有趣的事,但是它将花费很大的功夫。我觉得它需要大概10,000个模式才会开始变得真实起来。幸运的是,ALICE基金会提供了大量免费的AIML文件。在Alice Bot website上浏览AIML文件。

测试新建的机器人

目前为止,所有 XML 格式的 AIML 文件都准备好了。作为机器人大脑的组成部分,它们都很重要,不过目前它们只是信息(information)而已。机器人需要活过来。你可以借助任何语言定制 AIML。这里还是使用Python。

# -*- coding: utf-8 -*-
import aiml
import os
 
 
mybot_path = './mybot'
#切换到语料库所在工作目录
os.chdir(mybot_path)
 
mybot = aiml.Kernel()
mybot.learn("std-startup.xml")
mybot.respond('load aiml b')
 
while True:
  print mybot.respond(raw_input("Enter your message >> "))

这是我们可以开始的最简单的程序。它创建了一个aiml对象,学习启动文件,然后加载剩余的aiml文件。然后,它已经准备好聊天了,而我们进入了一个不断提示用户消息的无限循环。你将需要输入一个机器人认识的模式。这个模式取决于你加载了哪些AIML文件。我们将启动文件作为一个单独的实体创建,这样,我们之后可以向机器人添加更多的aiml文件,而不需要修改任何程序源码。我们可以在启动xml文件中添加更多的可供学习的文件。

加速Brain加载

当你开始拥有很多AIML文件时,它将花费很长的时间来学习。这就是brain文件从何而来。在机器人学习所有的AIML文件后,它可以直接将它的大脑保存到一个文件中,这个文件将会在后续的运行中动态加速加载时间。

# -*- coding: utf-8 -*-
import aiml
import os
 
 
mybot_path = './mybot'
#切换到语料库所在工作目录
os.chdir(mybot_path)
 
mybot = aiml.Kernel()
 
if os.path.isfile("mybot_brain.brn"):
  mybot.bootstrap(brainFile="mybot_brain.brn")
else:
  mybot.bootstrap(learnFiles="std-startup.xml", commands="load aiml b")
  mybot.saveBrain("mybot_brain.brn")
 
while True:
  print mybot.respond(raw_input("Enter your message >> "))

记住,如果你使用了上面写的brain方法,在运行的时候加载并不会将新增改变保存到brain中。你将需要删除brain文件以便于它在下一次启动的时候重建,或者需要修改代码,使得它在重新加载后的某个时间点保存brain。

增加Python命令

如果你想要为你的机器人提供一些特殊的运行Python函数的命令,那么,你应该为机器人捕获输入消息,然后在将它发送给mybot.respond()之前处理它。在上面的例子中,我们从raw_input中获得了用户的输入。然而,我们可以从任何地方获取输入。可能是一个TCP socket,或者是一个语音识别源码。在它进入到AIML之前处理这个消息。你可能想要在某些特定的消息上跳过AIML处理。

while True:
  message = raw_input("Enter your message >> ")
  if message == "quit":
    exit()
  elif message == "save":
    mybot.saveBrain("bot_brain.brn")
  else:
    bot_response = mybot.respond(message)
    # Do something with bot_response

会话与断言

通过指定一个会话,AIML可以为不同的人剪裁不同的会话。例如,如果某个人告诉机器人,他的名字是Alice,而另一个人告诉机器人他的名字是Bob,机器人可以区分不同的人。为了指定你所使用的会话,将其作为第二个参数传给respond()

sessionId = 12345
mybot.respond(raw_input(">>>"), sessionId)

这对于为每一个客户端定制个性化的对话是很有帮助的。你将必须以某种形式生成自己的会话ID,并且跟踪它。注意,保存brain文件不会保存所有的会话值。

sessionId = 12345
 
  # 会话信息作为字典获取. 包含输入输出历史,
  # 以及任何已知断言
  sessionData = mybot.getSessionData(sessionId)
 
  # 每一个会话ID需要时一个唯一值。
  # 断言名是机器人在与你的会话中了解到的某些/某个名字 
  # 机器人可能知道,你是"Billy",而你的狗的名字是"Brandy"
  mybot.setPredicate("dog", "Brandy", sessionId)
  clients_dogs_name = mybot.getPredicate("dog", sessionId)
 
  mybot.setBotPredicate("hometown", "127.0.0.1")
  bot_hometown = mybot.getBotPredicate("hometown")

在AIML中,我们可以使用模板中的set响应来设置断言

<aiml version="1.0.1" encoding="UTF-8">
  <category>
   <pattern>MY DOGS NAME IS *</pattern>
   <template>
     That is interesting that you have a dog named <set name="dog"><star/></set>
   </template> 
  </category> 
  <category>
   <pattern>WHAT IS MY DOGS NAME</pattern>
   <template>
     Your dog's name is <get name="dog"/>.
   </template> 
  </category> 
</aiml>

使用上面的AIML,你可以告诉机器人:

My dogs name is Max

而机器人会回答你:

That is interesting that you have a dog named Max

然后,如果你问机器人:

What is my dogs name?

机器人将会回答:

Your dog's name is Max.

aiml可以用来实现对话机器人,但是用于中文有以下问题:

  • 中文规则库较少。规则库相当于对话机器人的“大脑”,一般来说,规则库越丰富,对话机器人的应对就更像人。目前英文的规则库已经很丰富,涵盖面很广,而且是公开可获取的。但公开的中文规则库就基本没有。
  • AIML解释器对中文支持不好。实际上,Python下的Pyaiml模块(解析器)已经能比较好的支持中文,但是也存在以下问题:英文单词间一般都有空格或标点区分,因此具备一种“自然分词”特性,由于中文输入没有以空格分隔的习惯,以上会在实践中造成一些不便。比如要实现有/无空格的输入匹配,就需要在规则库中同时包含这两种模式。

解决方案:

  • 自己搭建语料库(比如从字幕文件中获取训练)
  • 自己中文分词工具(如jieba)

相关开源项目:

https://github.com/leo108/aliceCN
https://github.com/messense/wechat-bot
https://github.com/Program-O/Program-O

参考资料:

http://www.w3ii.com/aiml/aiml_introduction.html
http://www.devdungeon.com/content/ai-chat-bot-python-aiml
http://www.alicebot.org/documentation/aiml-reference.html

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python list 合并连接字符串的方法
Mar 09 Python
简单介绍Python中的JSON模块
Apr 08 Python
python简单实现旋转图片的方法
May 30 Python
python输入错误密码用户锁定实现方法
Nov 27 Python
pip命令无法使用的解决方法
Jun 12 Python
详解python3中zipfile模块用法
Jun 18 Python
详解python中的线程与线程池
May 10 Python
基于Tensorflow的MNIST手写数字识别分类
Jun 17 Python
Python如何实现后端自定义认证并实现多条件登陆
Jun 22 Python
Python 实现图片转字符画的示例(静态图片,gif皆可)
Nov 05 Python
python pygame 愤怒的小鸟游戏示例代码
Feb 25 Python
Python字典的基础操作
Nov 01 Python
Python迭代器与生成器用法实例分析
Jul 09 #Python
numpy的文件存储.npy .npz 文件详解
Jul 09 #Python
Python实现聊天机器人的示例代码
Jul 09 #Python
Atom的python插件和常用插件说明
Jul 08 #Python
Python中pip更新和三方插件安装说明
Jul 08 #Python
python中sys.argv函数精简概括
Jul 08 #Python
python输出100以内的质数与合数实例代码
Jul 08 #Python
You might like
Apache2中实现多网站域名绑定的实现方法
2011/06/01 PHP
PHP下载远程图片的几种方法总结
2017/04/07 PHP
JQuery 遮罩层实现(mask)实现代码
2010/01/09 Javascript
IE6,IE7下js动态加载图片不显示错误
2010/07/17 Javascript
jquery实现勾选复选框触发事件给input赋值
2015/02/01 Javascript
jQuery插件zoom实现图片全屏放大弹出层特效
2015/04/15 Javascript
javascript实现拖放效果
2015/12/16 Javascript
JSON字符串和JSON对象相互转化实例详解
2017/01/05 Javascript
老生常谈jquery id选择器和class选择器的区别
2017/02/12 Javascript
使用vue制作探探滑动堆叠组件的实例代码
2018/03/07 Javascript
Bootstrap table中toolbar新增条件查询及refresh参数使用方法
2018/05/18 Javascript
基于Vue 服务端Cookies删除的问题
2018/09/21 Javascript
详解使用React.memo()来优化函数组件的性能
2019/03/19 Javascript
Vue 中文本内容超出规定行数后展开收起的处理的实现方法
2019/04/28 Javascript
layui点击左侧导航栏,实现不刷新整个页面,只刷新局部的方法
2019/09/25 Javascript
vue页面引入three.js实现3d动画场景操作
2020/08/10 Javascript
JS画布动态实现黑客帝国背景效果
2020/11/08 Javascript
[43:36]Liquid vs Mineski 2018国际邀请赛小组赛BO2 第一场 8.18
2018/08/19 DOTA
python使用BeautifulSoup分析网页信息的方法
2015/04/04 Python
Python最基本的输入输出详解
2015/04/25 Python
python采集百度百科的方法
2015/06/05 Python
浅谈python中的正则表达式(re模块)
2017/10/17 Python
Python cookbook(数据结构与算法)从序列中移除重复项且保持元素间顺序不变的方法
2018/03/13 Python
python numpy和list查询其中某个数的个数及定位方法
2018/06/27 Python
Python 占位符的使用方法详解
2019/07/10 Python
python如何利用Mitmproxy抓包
2020/10/10 Python
The Body Shop美体小铺西班牙官网:天然化妆品
2019/06/21 全球购物
编写用C语言实现的求n阶阶乘问题的递归算法
2014/10/21 面试题
英语生日邀请函
2014/01/23 职场文书
市场营销毕业生自荐信范文
2014/04/01 职场文书
代办委托书怎样写
2014/04/08 职场文书
企业宗旨标语
2014/06/10 职场文书
群众路线表态发言材料
2014/10/17 职场文书
2021年最新用于图像处理的Python库总结
2021/06/15 Python
gojs实现蚂蚁线动画效果
2022/02/18 Javascript
golang定时器
2022/04/14 Golang