django 使用全局搜索功能的实例详解


Posted in Python onJuly 18, 2019

安装需要的包

1 第一步:

全文检索不同于特定字段的模糊查询,使用全文检索的效率更高,并且能够对于中文进行分词处理。

haystack:全文检索的框架,支持whoosh、solr、Xapian、Elasticsearc四种全文检索引擎

whoosh:纯Python编写的全文搜索引擎对于小型的站点,whoosh已经足够使用

jieba:一款免费的中文分词包

1)在虚拟环境中依次安装需要的包。

pip install django-haystack
pip install whoosh
pip install jieba

2 注册app

INSTALLED_APPS = (
  ...
  'haystack',
)

创建的models

class GoodInfo(models.Model):
    message = models.CharField(max_length=100)
    content = models.TextField()

    def __str__(self):
      return self.message

3 在settings 中配置搜索引擎

# 全文搜索引擎的配置
HAYSTACK_CONNECTIONS = {
  'default': {
    # 使用whoosh引擎
    'ENGINE': 'haystack.backend.whoosh_cn_backend.WhooshEngine',
    # 索引文件路径
    'PATH': os.path.join(BASE_DIR, 'whoosh_index'),
  }
}

#当添加、修改、删除数据时,自动生成索引
HAYSTACK_SIGNAL_PROCESSOR = 'haystack.signals.RealtimeSignalProcessor'

4 在项目的urls.py中添加搜索的配置。

url(r'^search/', include('haystack.urls')),

5 在创建的app目录下创建search_indexes.py 编写一下程序

from haystack import indexes
from .models import GoodInfo

# 对指定的某个类的某些数据建立索引
class GoodInfoIndex(indexes.SearchIndex, indexes.Indexable):
  text = indexes.CharField(document=True, use_template=True)

  def get_model(self):
    return GoodInfo

  def index_queryset(self, using=None):
    return self.get_model().objects.all()

6 在templates目录下创建"search/indexes/app06/"目录。(app06 为自己创建的app的名称)

在文件夹中创建 "goodinfo_text.txt"文件。 (goodinfo 为自己创建的数据库的名称)

#指定索引的属性
    {{object.content}} (content 为自己创建的表的一个字段 把这个字段指定为索引字段)

7 找到虚拟环境django下安装的haystack目录。

/home/python/.virtualenvs/django/lib/python2.7/site-packages/haystack/backends/

在上面的目录中创建ChineseAnalyzer.py文件。

import jieba
  from whoosh.analysis import Tokenizer, Token

  class ChineseTokenizer(Tokenizer):
    def __call__(self, value, positions=False, chars=False,
           keeporiginal=False, removestops=True,
           start_pos=0, start_char=0, mode='', **kwargs):
      t = Token(positions, chars, removestops=removestops, mode=mode,
           **kwargs)
      seglist = jieba.cut(value, cut_all=True)
      for w in seglist:
        t.original = t.text = w
        t.boost = 1.0
        if positions:
          t.pos = start_pos + value.find(w)
        if chars:
          t.startchar = start_char + value.find(w)
          t.endchar = start_char + value.find(w) + len(w)
        yield t

  def ChineseAnalyzer():
    return ChineseTokenizer()

8)复制whoosh_backend.py文件,改为如下名称:

注意:复制出来的文件名,末尾会有一个空格,记得要删除这个空格。

whoosh_cn_backend.py

9)打开复制出来的新文件,引入中文分析类,内部采用jieba分词。

from .ChineseAnalyzer import ChineseAnalyzer

10)更改词语分析类。

查找

analyzer=StemmingAnalyzer()

改为

analyzer=ChineseAnalyzer()

11)初始化索引数据。

python manage.py rebuild_index

按照提示 输入 y 后 生成索引 在主目录下 会生成一个whoosh_index 文件夹 其中放置三个索引文件

配置好后 就该开始使用了

按照配置,在admin管理中添加数据后,会自动为数据创建索引,可以直接进行搜索,可以先创建一些测试数据。

1)在app06/views.py中定义视图query。

def query(request):
  return render(request,'booktest/query.html')

2)在app06/urls.py中配置。

url(r'^query/', views.query),

3)在templates/app06/目录中创建模板query.html。

参数q表示搜索内容,传递到模板中的数据为query。

<html>
<head>
  <title>全文检索</title>
</head>
<body>
<form method='get' action="/search/" target="_blank">( 提交的路径就是 在urls 中配置的)
  <input type="text" name="q"> # (这里注意 input的name属性 必须是 q 不能改变)
  <br>
  <input type="submit" value="查询">
</form>
</body>
</html>

4)自定义搜索结果模板:在templates/search/目录下创建search.html。

搜索结果进行分页,视图向模板中传递的上下文如下:

(这个上下文 是 搜素引擎自动给返回的 不需要我们自己去写视图函数来进行返回 直接进行使用就可以)

query:搜索关键字

page:当前页的page对象

paginator:分页paginator对象

视图接收的参数如下:

参数q表示搜索内容,传递到模板中的数据为query

参数page表示当前页码

<html>
<head>
  <title>全文检索--结果页</title>
</head>
<body>
<h1>搜索 <b>{{query}}</b> 结果如下:</h1>
<ul>
{%for item in page%}  (注意这里面的对象的获取方式 )
  <li>{{item.object.id}}--{{item.object.content|safe}}</li>
{%empty%}
  <li>啥也没找到</li>
{%endfor%}
</ul>
<hr>
{%for pindex in page.paginator.page_range%} (后面的是返回的是全部的页码)
  {%if pindex == page.number%} (page.number) 返回的是当前的页码
    {{pindex}}  
  {%else%} (按照页码进行翻页的时候 也要注意 这样的翻页方式)
    <a href="?q={{query}}&page={{pindex}}" rel="external nofollow" >{{pindex}}</a>  
  {%endif%}
{%endfor%}
</body>
</html>

5)运行服务器,在浏览器中输入如下地址:

http://127.0.0.1:8000/query/

以上这篇django 使用全局搜索功能的实例详解就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python判断两个对象相等的原理
Dec 12 Python
Python反转序列的方法实例分析
Mar 21 Python
解决pycharm py文件运行后停止按钮变成了灰色的问题
Nov 29 Python
python三大神器之fabric使用教程
Jun 10 Python
Python 安装第三方库 pip install 安装慢安装不上的解决办法
Jun 18 Python
通过cmd进入python的实例操作
Jun 26 Python
Pytorch在NLP中的简单应用详解
Jan 08 Python
Python tkinter布局与按钮间距设置方式
Mar 04 Python
Selenium向iframe富文本框输入内容过程图解
Apr 10 Python
Python faker生成器生成虚拟数据代码实例
Jul 20 Python
浅谈Python3中print函数的换行
Aug 05 Python
Python 删除List元素的三种方法remove、pop、del
Nov 16 Python
Django中Middleware中的函数详解
Jul 18 #Python
对DJango视图(views)和模版(templates)的使用详解
Jul 17 #Python
react+django清除浏览器缓存的几种方法小结
Jul 17 #Python
在Pycharm中调试Django项目程序的操作方法
Jul 17 #Python
在Django model中设置多个字段联合唯一约束的实例
Jul 17 #Python
对django views中 request, response的常用操作详解
Jul 17 #Python
python自带tkinter库实现棋盘覆盖图形界面
Jul 17 #Python
You might like
强烈推荐:php.ini中文版(2)
2006/10/09 PHP
PHP5.2中date()函数显示时间与北京时间相差8小时的解决办法
2009/05/28 PHP
微信公众平台开发-微信服务器IP接口实例(含源码)
2017/03/05 PHP
PHP实现数组转JSon和JSon转数组的方法示例
2018/06/14 PHP
用js实现键盘方向键翻页功能的代码
2007/06/03 Javascript
父页面显示遮罩层弹出半透明状态的dialog
2014/03/04 Javascript
介绍JavaScript的一个微型模版
2015/06/24 Javascript
jQuery中(function($){})(jQuery)详解
2015/07/15 Javascript
jQuery左侧大图右侧小图焦点图幻灯切换代码分享
2015/08/19 Javascript
echarts3 使用总结(绘制各种图表,地图)
2017/01/05 Javascript
jQuery实现弹出窗口弹出div层的实例代码
2017/01/09 Javascript
JSON键值对序列化和反序列化解析
2017/01/24 Javascript
xmlplus组件设计系列之按钮(2)
2017/04/26 Javascript
VUE实现一个分页组件的示例
2017/09/13 Javascript
详解使用mpvue开发github小程序总结
2018/07/25 Javascript
详解js访问对象的属性和方法
2018/10/25 Javascript
了解重排与重绘
2019/05/29 Javascript
微信小程序和H5页面间相互跳转代码实例
2019/09/19 Javascript
微信小程序保存图片到相册权限设置
2020/04/09 Javascript
微信小程序实现拼图小游戏
2020/10/22 Javascript
vue自定义组件实现双向绑定
2021/01/13 Vue.js
Python使用正则表达式过滤或替换HTML标签的方法详解
2017/09/25 Python
Python实现的线性回归算法示例【附csv文件下载】
2018/12/29 Python
Python选择网卡发包及接收数据包
2019/04/04 Python
Python爬虫实现自动登录、签到功能的代码
2020/08/20 Python
Flask-SocketIO服务端安装及使用代码示例
2020/11/26 Python
System.Array.CopyTo()和System.Array.Clone()有什么区别
2016/06/20 面试题
单位刻章介绍信范文
2014/01/11 职场文书
新年主持词
2014/03/27 职场文书
电子信息工程自荐信
2014/05/26 职场文书
社区矫正工作方案
2014/06/04 职场文书
医院护士党的群众路线教育实践活动对照检查材料思想汇报
2014/10/04 职场文书
2014年体育部工作总结
2014/11/13 职场文书
OpenCV图像变换之傅里叶变换的一些应用
2021/07/26 Python
默认网关不可用修复后过一会又不好使了解决方法
2022/04/08 数码科技
零基础学java之带返回值的方法的定义和调用
2022/04/10 Java/Android