python同义词替换的实现(jieba分词)


Posted in Python onJanuary 21, 2020

TihuanWords.txt文档格式

注意:同一行的词用单个空格隔开,每行第一个词为同行词的替换词。

年休假 年假 年休
究竟 到底
回家场景 我回来了

代码

import jieba


def replaceSynonymWords(string1):
 # 1读取同义词表,并生成一个字典。
 combine_dict = {}
 # synonymWords.txt是同义词表,每行是一系列同义词,用空格分割
 for line in open("TihuanWords.txt", "r", encoding='utf-8'):
   seperate_word = line.strip().split(" ")
   num = len(seperate_word)
   for i in range(1, num):
     combine_dict[seperate_word[i]] = seperate_word[0]
   print(seperate_word)
 print(combine_dict)

 # 2提升某些词的词频,使其能够被jieba识别出来
 jieba.suggest_freq("年休假", tune=True)

 # 3将语句切分成单词
 seg_list = jieba.cut(string1, cut_all=False)

 f = "/".join(seg_list).encode("utf-8")
 f = f.decode("utf-8")
 print(f)
 # 4返回同义词替换后的句子
 final_sentence = " "
 for word in f.split('/'):
   if word in combine_dict:
     word = combine_dict[word]
     final_sentence += word
   else:
     final_sentence += word
 # print final_sentence
 return final_sentence


string1 = '年休到底放几天?'
print(replaceSynonymWords(string1))

结果

python同义词替换的实现(jieba分词)

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Windows上使用virtualenv搭建Python+Flask开发环境
Jun 07 Python
深入理解Django的中间件middleware
Mar 14 Python
DataFrame 将某列数据转为数组的方法
Apr 13 Python
Python 3.6 读取并操作文件内容的实例
Apr 23 Python
Python设计模式之代理模式实例详解
Jan 19 Python
Python Opencv提取图片中某种颜色组成的图形的方法
Sep 19 Python
python从zip中删除指定后缀文件(推荐)
Dec 05 Python
利用Python中的Xpath实现一个在线汇率转换器
Sep 09 Python
基于Python实现粒子滤波效果
Dec 01 Python
Numpy ndarray 多维数组对象的使用
Feb 10 Python
只用20行Python代码实现屏幕录制功能
Jun 02 Python
Django框架中表单的用法
Jun 10 Python
tensorflow模型保存、加载之变量重命名实例
Jan 21 #Python
tensorflow实现测试时读取任意指定的check point的网络参数
Jan 21 #Python
tensorflow如何继续训练之前保存的模型实例
Jan 21 #Python
在tensorflow中设置保存checkpoint的最大数量实例
Jan 21 #Python
TensorFlow——Checkpoint为模型添加检查点的实例
Jan 21 #Python
tensorflow estimator 使用hook实现finetune方式
Jan 21 #Python
Python实现FLV视频拼接功能
Jan 21 #Python
You might like
PHP版本的选择5.2.17 5.3.27 5.3.28 5.4 5.5兼容性问题分析
2016/04/04 PHP
HTML中事件触发列表与解说
2007/07/09 Javascript
javascript 内存回收机制理解
2011/01/17 Javascript
浅谈jQuery中 wrap() wrapAll() 与 wrapInner()的差异
2014/11/12 Javascript
jquery合并表格中相同文本的相邻单元格
2015/07/17 Javascript
分享jQuery封装好的一些常用操作
2016/07/28 Javascript
js字符串引用的两种方式(必看)
2016/09/18 Javascript
vue2.0+webpack环境的构造过程
2016/11/08 Javascript
JS库 Highlightjs 添加代码行号的实现代码
2017/09/13 Javascript
详解如何在项目中使用jest测试react native组件
2018/02/09 Javascript
JS字符串去除连续或全部重复字符的实例
2018/03/08 Javascript
浅谈React高阶组件
2018/03/28 Javascript
Vue.use源码学习小结
2018/06/20 Javascript
Python入门_学会创建并调用函数的方法
2017/05/16 Python
python批量查询、汉字去重处理CSV文件
2018/05/31 Python
python通过微信发送邮件实现电脑关机
2018/06/20 Python
Python线程之定位与销毁的实现
2019/02/17 Python
Python 获取指定文件夹下的目录和文件的实现
2019/08/30 Python
pycharm显示远程图片的实现
2019/11/04 Python
python 识别登录验证码图片功能的实现代码(完整代码)
2020/07/03 Python
Python如何定义有可选参数的元类
2020/07/31 Python
详解python tcp编程
2020/08/24 Python
Python jieba库分词模式实例用法
2021/01/13 Python
HTML5跳转小程序wx-open-launch-weapp的示例代码
2020/07/16 HTML / CSS
在c#中using和new这两个关键字有什么意义
2013/05/19 面试题
软件配置管理有什么好处
2015/04/15 面试题
你们项目是如何进行变更控制的
2015/08/26 面试题
高三自我鉴定
2013/10/23 职场文书
函授大专自我鉴定
2013/11/01 职场文书
校园奶茶店创业计划书
2014/01/23 职场文书
文明班级申报材料
2014/12/24 职场文书
四年级小学生评语
2014/12/26 职场文书
运动会致辞稿
2015/07/29 职场文书
推广普通话主题班会
2015/08/17 职场文书
2016年综治和平安建设宣传月活动总结
2016/04/01 职场文书
python实现进度条的多种实现
2021/04/29 Python