MySQL 全文索引使用指南


Posted in MySQL onMay 25, 2021

全文索引需要特殊的查询语法。有没有索引都可以进行全文检索,但是存在索引时会提高匹配的速度。全文索引的索引通过特殊的结构存储以便于找到文档中包含搜索关键字对应的内容。在我们日常生活中,最常见的全文检索就是网络搜索引擎。虽然,网络搜索引擎的数据里十分庞大,并且通常也不会使用关系型数据库,但是原理是相似的。

全文索引支持通过基于字符(CHAR、VARCHAR 和 TEXT 类型的列)的检索,也可以支持自然语言模式(Natural Language Mode, 默认)和布尔模式 (Boolean Mode)。例如我们搜索“数据库引擎”的时候,内容中包括“数据库”、“引擎”和“数据库引擎”的内容都会检索出来。全文索引的实现有大量的限制,而且十分复杂。但是由于内置在MySQL服务端,而且对很多应用都能够满足要求,因此被广泛使用。

在MySQL5.6之前的版本中,只有 MyISAM 存储引擎支持全文索引。创建全文索引需要指定列标记为全文索引,如下面的 content 列。

CREATE TABLE t_news (
	id INT UNSIGNED AUTO_INCREMENT NOT NULL PRIMARY KEY,
	content TEXT,
	author VARCHAR(32),
	title VARCHAR(128),
  FULLTEXT (content)
) ENGINE=InnoDB;

MySQL 5.6以前对中文搜索支持不是太好,需要自己进行分词后将段落预处理拆分成单词在入库。MySQL5.7.6后才有了内置的分词器 ngram。ngram 支持设置设置分词的长度,可以将中文按长度拆分为不同的单词(虽然不太智能,但满足大部分场景)。可以通过 MySQL 的全局变量ngram_token_size设置分词长度,默认是2,支持1-10可选。对于上面的例子,需要指定分词器构建全文索引。

CREATE TABLE t_news (
  id INT UNSIGNED AUTO_INCREMENT NOT NULL PRIMARY KEY,
	content TEXT,
	author VARCHAR(32),
	title VARCHAR(128),
  FULLTEXT KEY idx(content) WITH PARSER ngram
) ENGINE=InnoDB;

插入一条数据测试。

INSERT INTO `t_news` 
(`id`, `content`, `author`, `title`) 
VALUES ('1', '我有一个数据库和引擎', '岛上码农', '数据库引擎');

在简单的模糊搜索中可以使用 LIKE 来完成,而对于全文检索需要使用如下方式的语句:

SELECT * FROM t_news 
WHERE MATCH (content) AGAINST ('数据 引擎' IN NATURAL LANGUAGE MODE)

通过这种方式可以检索出刚刚插入的内容,而如果使用 LIKE 是没法完成的。也支持使用相关性排序,再插入一条数据:

INSERT INTO `t_news`
(`id`, `content`, `author`, `title`) 
VALUES (2,'我有一个数据库','岛上码农','数据库')

然后执行排序查询:

SELECT *, MATCH (content) AGAINST ('数据 引擎' ) AS relevance
FROM t_news 
WHERE MATCH (content) AGAINST ('数据 引擎' ) 
ORDER BY relevance ASC

这里将匹配值作为一列查询,以便使用其别名进行排序。相关性越高,对应的 relevance 值越大,因此可以用作排序。入股不相关,那么 relevance 的值为0。

布尔模式可以做更多的控制,例如包括使用+号保留匹配结果和使用-号排除匹配结果,下面的就匹配了数据,而排除了包含引擎的数据。更多操作符可以参考 MySQL 的官方文档:全文索引操作符

SELECT * FROM t_news 
WHERE MATCH (content) AGAINST ('+数据* -引擎' IN BOOLEAN MODE);

以上就是MySQL 全文索引使用指南的详细内容,更多关于MySQL 全文索引的资料请关注三水点靠木其它相关文章!

MySQL 相关文章推荐
Mysql 性能监控及调优
Apr 06 MySQL
52条SQL语句教你性能优化
May 25 MySQL
MYSQL数据库使用UTF-8中文编码乱码的解决办法
May 26 MySQL
详解MySQL多版本并发控制机制(MVCC)源码
Jun 23 MySQL
SQL实现LeetCode(176.第二高薪水)
Aug 04 MySQL
Mysql案例刨析事务隔离级别
Sep 25 MySQL
mysql下的max_allowed_packet参数设置详解
Feb 12 MySQL
一次SQL如何查重及去重的实战记录
Mar 13 MySQL
浅谈MySQL中的六种日志
Mar 23 MySQL
MySql重置root密码 --skip-grant-tables
Apr 11 MySQL
为什么MySQL8新特性会修改自增主键属性
Apr 18 MySQL
面试官问我Mysql的存储引擎了解多少
Aug 05 MySQL
52条SQL语句教你性能优化
May 25 #MySQL
简单了解 MySQL 中相关的锁
mysql在项目中怎么选事务隔离级别
.Net Core导入千万级数据至Mysql的步骤
May 24 #MySQL
MySQL大小写敏感的注意事项
May 24 #MySQL
MySQL 使用事件(Events)完成计划任务
May 24 #MySQL
MySQL触发器的使用
May 24 #MySQL
You might like
php中实现记住密码自动登录的代码
2011/03/02 PHP
php去除html标记的原生函数详解
2015/01/27 PHP
php数组添加与删除单元的常用函数实例分析
2015/02/16 PHP
php导出csv文件,可导出前导0实例代码
2016/11/16 PHP
js实现文字超出部分用省略号代替实例代码
2016/09/01 Javascript
jQuery dateRangePicker插件使用方法详解
2017/07/28 jQuery
[js高手之路]图解javascript的原型(prototype)对象,原型链实例
2017/08/28 Javascript
vue.js 中使用(...)运算符报错的解决方法
2018/08/09 Javascript
vue-cli项目无法用本机IP访问的解决方法
2018/09/20 Javascript
深入学习Vue nextTick的用法及原理
2019/10/08 Javascript
微信小程序获取当前位置和城市名
2019/11/13 Javascript
wxPython框架类和面板类的使用实例
2014/09/28 Python
Python 多进程和数据传递的理解
2017/10/09 Python
numpy基础教程之np.linalg
2019/02/12 Python
PyTorch 解决Dataset和Dataloader遇到的问题
2020/01/08 Python
适合Python初学者的一些编程技巧
2020/02/12 Python
python中if及if-else如何使用
2020/06/02 Python
基于TensorFlow的CNN实现Mnist手写数字识别
2020/06/17 Python
Python切片列表字符串如何实现切换
2020/08/06 Python
PyCharm vs VSCode,作为python开发者,你更倾向哪种IDE呢?
2020/08/17 Python
python 爬取小说并下载的示例
2020/12/07 Python
html5 canvas实现跟随鼠标旋转的箭头
2016/03/11 HTML / CSS
HTML里显示pdf、word、xls、ppt的方法示例
2020/04/14 HTML / CSS
英国现代家具和装饰网站:PN Home
2018/08/16 全球购物
美国在线眼镜店:GlassesShop
2018/11/15 全球购物
高中美术教学反思
2014/01/19 职场文书
幼儿园中班教学反思
2014/02/10 职场文书
高中军训感言500字
2014/02/24 职场文书
酒店辞职信怎么写
2015/02/27 职场文书
2015年先进个人自荐书
2015/03/24 职场文书
行政处罚听证告知书
2015/07/01 职场文书
通过shell脚本对mysql的增删改查及my.cnf的配置
2021/07/07 MySQL
MYSQL 的10大经典优化案例场景实战
2021/09/14 MySQL
Java数组详细介绍及相关工具类
2022/04/14 Java/Android
使用CSS自定义属性实现骨架屏效果
2022/06/21 HTML / CSS
Win11怎么添加用户?Win11添加用户账户的方法
2022/07/15 数码科技