python同义词替换的实现(jieba分词)


Posted in Python onJanuary 21, 2020

TihuanWords.txt文档格式

注意:同一行的词用单个空格隔开,每行第一个词为同行词的替换词。

年休假 年假 年休
究竟 到底
回家场景 我回来了

代码

import jieba


def replaceSynonymWords(string1):
 # 1读取同义词表,并生成一个字典。
 combine_dict = {}
 # synonymWords.txt是同义词表,每行是一系列同义词,用空格分割
 for line in open("TihuanWords.txt", "r", encoding='utf-8'):
   seperate_word = line.strip().split(" ")
   num = len(seperate_word)
   for i in range(1, num):
     combine_dict[seperate_word[i]] = seperate_word[0]
   print(seperate_word)
 print(combine_dict)

 # 2提升某些词的词频,使其能够被jieba识别出来
 jieba.suggest_freq("年休假", tune=True)

 # 3将语句切分成单词
 seg_list = jieba.cut(string1, cut_all=False)

 f = "/".join(seg_list).encode("utf-8")
 f = f.decode("utf-8")
 print(f)
 # 4返回同义词替换后的句子
 final_sentence = " "
 for word in f.split('/'):
   if word in combine_dict:
     word = combine_dict[word]
     final_sentence += word
   else:
     final_sentence += word
 # print final_sentence
 return final_sentence


string1 = '年休到底放几天?'
print(replaceSynonymWords(string1))

结果

python同义词替换的实现(jieba分词)

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python远程登录代码
Apr 29 Python
使用Python脚本实现批量网站存活检测遇到问题及解决方法
Oct 11 Python
使用python在本地电脑上快速处理数据
Jun 22 Python
查找python项目依赖并生成requirements.txt的方法
Jul 10 Python
Python合并多个Excel数据的方法
Jul 16 Python
用Python将mysql数据导出成json的方法
Aug 21 Python
如何在Django配置文件里配置session链接
Aug 06 Python
Windows10下Tensorflow2.0 安装及环境配置教程(图文)
Nov 21 Python
Python qrcode 生成一个二维码的实例详解
Feb 12 Python
python对数组进行排序,并输出排序后对应的索引值方式
Feb 28 Python
手把手教你安装Windows版本的Tensorflow
Mar 26 Python
python Polars库的使用简介
Apr 21 Python
tensorflow模型保存、加载之变量重命名实例
Jan 21 #Python
tensorflow实现测试时读取任意指定的check point的网络参数
Jan 21 #Python
tensorflow如何继续训练之前保存的模型实例
Jan 21 #Python
在tensorflow中设置保存checkpoint的最大数量实例
Jan 21 #Python
TensorFlow——Checkpoint为模型添加检查点的实例
Jan 21 #Python
tensorflow estimator 使用hook实现finetune方式
Jan 21 #Python
Python实现FLV视频拼接功能
Jan 21 #Python
You might like
网站加速 PHP 缓冲的免费实现方法
2006/10/09 PHP
用PHP和ACCESS写聊天室(一)
2006/10/09 PHP
Dojo 学习笔记入门篇 First Dojo Example
2009/11/15 Javascript
javascript 获取元素样式必杀技
2014/05/04 Javascript
javascript引用赋值(地址传值)用法实例
2015/01/13 Javascript
jQuery插件bxSlider实现响应式焦点图
2015/04/12 Javascript
浅谈javascript的Touch事件
2015/09/27 Javascript
JS中多步骤多分步的StepJump组件实例详解
2016/04/01 Javascript
浅析jquery unbind()方法移除元素绑定的事件
2016/05/24 Javascript
BootStrap实现响应式布局导航栏折叠隐藏效果(在小屏幕、手机屏幕浏览时自动折叠隐藏)
2016/11/30 Javascript
原生JS改变透明度实现轮播效果
2017/03/24 Javascript
js 数字、字符串、布尔值的转换方法(必看)
2017/04/07 Javascript
9种使用Chrome Firefox 自带调试工具调试javascript技巧
2017/12/22 Javascript
js for终止循环 跳出多层循环
2018/10/04 Javascript
vue生命周期的探索
2019/04/03 Javascript
详解Vue2.5+迁移至Typescript指南
2019/08/01 Javascript
jQuery 选择器用法实例分析【prev + next】
2020/05/22 jQuery
python3使用tkinter实现ui界面简单实例
2014/01/10 Python
python制作一个桌面便签软件
2015/08/09 Python
Python基础语法(Python基础知识点)
2016/02/28 Python
Eclipse和PyDev搭建完美Python开发环境教程(Windows篇)
2016/11/16 Python
pandas DataFrame实现几列数据合并成为新的一列方法
2018/06/08 Python
python微信聊天机器人改进版(定时或触发抓取天气预报、励志语录等,向好友推送)
2019/04/25 Python
如何使用Python自动控制windows桌面
2019/07/11 Python
Python中的引用和拷贝实例解析
2019/11/14 Python
Python中zip()函数的解释和可视化(实例详解)
2020/02/16 Python
Python的in,is和id函数代码实例
2020/04/18 Python
Python制作数据预测集成工具(值得收藏)
2020/08/21 Python
挪威手表购物网站:Klokker
2016/09/19 全球购物
英国拳击装备购物网站:RDX Sports
2018/01/23 全球购物
教师推荐信范文
2013/11/24 职场文书
社区七一党员活动方案
2014/01/25 职场文书
一分钟演讲稿
2014/04/30 职场文书
校园环境卫生倡议书
2015/04/29 职场文书
2016党员党课心得体会
2016/01/07 职场文书
2016年学校十一国庆节活动总结
2016/04/01 职场文书