django 使用全局搜索功能的实例详解


Posted in Python onJuly 18, 2019

安装需要的包

1 第一步:

全文检索不同于特定字段的模糊查询,使用全文检索的效率更高,并且能够对于中文进行分词处理。

haystack:全文检索的框架,支持whoosh、solr、Xapian、Elasticsearc四种全文检索引擎

whoosh:纯Python编写的全文搜索引擎对于小型的站点,whoosh已经足够使用

jieba:一款免费的中文分词包

1)在虚拟环境中依次安装需要的包。

pip install django-haystack
pip install whoosh
pip install jieba

2 注册app

INSTALLED_APPS = (
  ...
  'haystack',
)

创建的models

class GoodInfo(models.Model):
    message = models.CharField(max_length=100)
    content = models.TextField()

    def __str__(self):
      return self.message

3 在settings 中配置搜索引擎

# 全文搜索引擎的配置
HAYSTACK_CONNECTIONS = {
  'default': {
    # 使用whoosh引擎
    'ENGINE': 'haystack.backend.whoosh_cn_backend.WhooshEngine',
    # 索引文件路径
    'PATH': os.path.join(BASE_DIR, 'whoosh_index'),
  }
}

#当添加、修改、删除数据时,自动生成索引
HAYSTACK_SIGNAL_PROCESSOR = 'haystack.signals.RealtimeSignalProcessor'

4 在项目的urls.py中添加搜索的配置。

url(r'^search/', include('haystack.urls')),

5 在创建的app目录下创建search_indexes.py 编写一下程序

from haystack import indexes
from .models import GoodInfo

# 对指定的某个类的某些数据建立索引
class GoodInfoIndex(indexes.SearchIndex, indexes.Indexable):
  text = indexes.CharField(document=True, use_template=True)

  def get_model(self):
    return GoodInfo

  def index_queryset(self, using=None):
    return self.get_model().objects.all()

6 在templates目录下创建"search/indexes/app06/"目录。(app06 为自己创建的app的名称)

在文件夹中创建 "goodinfo_text.txt"文件。 (goodinfo 为自己创建的数据库的名称)

#指定索引的属性
    {{object.content}} (content 为自己创建的表的一个字段 把这个字段指定为索引字段)

7 找到虚拟环境django下安装的haystack目录。

/home/python/.virtualenvs/django/lib/python2.7/site-packages/haystack/backends/

在上面的目录中创建ChineseAnalyzer.py文件。

import jieba
  from whoosh.analysis import Tokenizer, Token

  class ChineseTokenizer(Tokenizer):
    def __call__(self, value, positions=False, chars=False,
           keeporiginal=False, removestops=True,
           start_pos=0, start_char=0, mode='', **kwargs):
      t = Token(positions, chars, removestops=removestops, mode=mode,
           **kwargs)
      seglist = jieba.cut(value, cut_all=True)
      for w in seglist:
        t.original = t.text = w
        t.boost = 1.0
        if positions:
          t.pos = start_pos + value.find(w)
        if chars:
          t.startchar = start_char + value.find(w)
          t.endchar = start_char + value.find(w) + len(w)
        yield t

  def ChineseAnalyzer():
    return ChineseTokenizer()

8)复制whoosh_backend.py文件,改为如下名称:

注意:复制出来的文件名,末尾会有一个空格,记得要删除这个空格。

whoosh_cn_backend.py

9)打开复制出来的新文件,引入中文分析类,内部采用jieba分词。

from .ChineseAnalyzer import ChineseAnalyzer

10)更改词语分析类。

查找

analyzer=StemmingAnalyzer()

改为

analyzer=ChineseAnalyzer()

11)初始化索引数据。

python manage.py rebuild_index

按照提示 输入 y 后 生成索引 在主目录下 会生成一个whoosh_index 文件夹 其中放置三个索引文件

配置好后 就该开始使用了

按照配置,在admin管理中添加数据后,会自动为数据创建索引,可以直接进行搜索,可以先创建一些测试数据。

1)在app06/views.py中定义视图query。

def query(request):
  return render(request,'booktest/query.html')

2)在app06/urls.py中配置。

url(r'^query/', views.query),

3)在templates/app06/目录中创建模板query.html。

参数q表示搜索内容,传递到模板中的数据为query。

<html>
<head>
  <title>全文检索</title>
</head>
<body>
<form method='get' action="/search/" target="_blank">( 提交的路径就是 在urls 中配置的)
  <input type="text" name="q"> # (这里注意 input的name属性 必须是 q 不能改变)
  <br>
  <input type="submit" value="查询">
</form>
</body>
</html>

4)自定义搜索结果模板:在templates/search/目录下创建search.html。

搜索结果进行分页,视图向模板中传递的上下文如下:

(这个上下文 是 搜素引擎自动给返回的 不需要我们自己去写视图函数来进行返回 直接进行使用就可以)

query:搜索关键字

page:当前页的page对象

paginator:分页paginator对象

视图接收的参数如下:

参数q表示搜索内容,传递到模板中的数据为query

参数page表示当前页码

<html>
<head>
  <title>全文检索--结果页</title>
</head>
<body>
<h1>搜索 <b>{{query}}</b> 结果如下:</h1>
<ul>
{%for item in page%}  (注意这里面的对象的获取方式 )
  <li>{{item.object.id}}--{{item.object.content|safe}}</li>
{%empty%}
  <li>啥也没找到</li>
{%endfor%}
</ul>
<hr>
{%for pindex in page.paginator.page_range%} (后面的是返回的是全部的页码)
  {%if pindex == page.number%} (page.number) 返回的是当前的页码
    {{pindex}}  
  {%else%} (按照页码进行翻页的时候 也要注意 这样的翻页方式)
    <a href="?q={{query}}&page={{pindex}}" rel="external nofollow" >{{pindex}}</a>  
  {%endif%}
{%endfor%}
</body>
</html>

5)运行服务器,在浏览器中输入如下地址:

http://127.0.0.1:8000/query/

以上这篇django 使用全局搜索功能的实例详解就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python实现的简单发送邮件脚本分享
Nov 07 Python
Python简单实现的代理服务器端口映射功能示例
Apr 08 Python
django进阶之cookie和session的使用示例
Aug 17 Python
python 格式化输出百分号的方法
Jan 20 Python
Python实现图片转字符画的代码实例
Feb 22 Python
python os.path.isfile 的使用误区详解
Nov 29 Python
pandas中的数据去重处理的实现方法
Feb 10 Python
python3用urllib抓取贴吧邮箱和QQ实例
Mar 10 Python
Python如何对齐字符串
Jul 30 Python
python的链表基础知识点
Sep 13 Python
Django集成富文本编辑器summernote的实现步骤
May 31 Python
Python中rapidjson参数校验实现
Jul 25 Python
Django中Middleware中的函数详解
Jul 18 #Python
对DJango视图(views)和模版(templates)的使用详解
Jul 17 #Python
react+django清除浏览器缓存的几种方法小结
Jul 17 #Python
在Pycharm中调试Django项目程序的操作方法
Jul 17 #Python
在Django model中设置多个字段联合唯一约束的实例
Jul 17 #Python
对django views中 request, response的常用操作详解
Jul 17 #Python
python自带tkinter库实现棋盘覆盖图形界面
Jul 17 #Python
You might like
PHP 数组遍历方法大全(foreach,list,each)
2010/06/30 PHP
php通过文件头检测文件类型通用代码类(zip,rar等)
2010/10/19 PHP
php常用hash加密函数
2014/11/22 PHP
PHP实现搜索相似图片
2015/09/22 PHP
Laravel框架实现定时发布任务的方法
2018/08/16 PHP
laravel 框架实现无限级分类的方法示例
2019/10/31 PHP
PHP安全之register_globals的on和off的区别
2020/07/23 PHP
js对数字的格式化使用说明
2011/01/12 Javascript
Javascript类定义语法,私有成员、受保护成员、静态成员等介绍
2011/12/08 Javascript
js检查页面上有无重复id的实现代码
2013/07/17 Javascript
javascript实现十秒钟后注册按钮可点击的方法
2015/05/13 Javascript
JS或jQuery获取ASP.NET服务器控件ID的方法
2015/06/08 Javascript
配置Grunt的Task时通配符支持和动态生成文件名问题
2015/09/06 Javascript
JQuery标签页效果实例详解
2015/12/24 Javascript
AngualrJS中的Directive制作一个菜单
2016/01/26 Javascript
Three.js学习之几何形状
2016/08/01 Javascript
jQuery的Read()方法代替原生JS详解
2016/11/08 Javascript
详解vue2.0+axios+mock+axios-mock+adapter实现登陆
2018/07/19 Javascript
详解Bootstrap 学习(一)入门
2019/04/12 Javascript
js实现自定义滚动条的示例
2020/10/27 Javascript
[07:09]2014DOTA2国际邀请赛-Newbee再次发威成功晋级决赛
2014/07/19 DOTA
Python中函数参数设置及使用的学习笔记
2016/05/03 Python
Python与Java间Socket通信实例代码
2017/03/06 Python
Python实现获取汉字偏旁部首的方法示例【测试可用】
2018/12/18 Python
Pycharm如何打断点的方法步骤
2019/06/13 Python
Python django搭建layui提交表单,表格,图标的实例
2019/11/18 Python
基于python 取余问题(%)详解
2020/06/03 Python
Python Celery异步任务队列使用方法解析
2020/08/10 Python
Python的信号库Blinker用法详解
2020/12/31 Python
美国战术品牌:5.11 Tactical
2019/05/01 全球购物
招股说明书范本
2014/05/06 职场文书
学习型党组织建设经验材料
2014/05/26 职场文书
2014年企业党建工作总结
2014/12/18 职场文书
2015暑假假期总结
2015/07/13 职场文书
2017元旦、春节期间廉洁自律承诺书
2016/03/25 职场文书
Python 的 sum() Pythonic 的求和方法详细
2021/10/16 Python