python同义词替换的实现(jieba分词)


Posted in Python onJanuary 21, 2020

TihuanWords.txt文档格式

注意:同一行的词用单个空格隔开,每行第一个词为同行词的替换词。

年休假 年假 年休
究竟 到底
回家场景 我回来了

代码

import jieba


def replaceSynonymWords(string1):
 # 1读取同义词表,并生成一个字典。
 combine_dict = {}
 # synonymWords.txt是同义词表,每行是一系列同义词,用空格分割
 for line in open("TihuanWords.txt", "r", encoding='utf-8'):
   seperate_word = line.strip().split(" ")
   num = len(seperate_word)
   for i in range(1, num):
     combine_dict[seperate_word[i]] = seperate_word[0]
   print(seperate_word)
 print(combine_dict)

 # 2提升某些词的词频,使其能够被jieba识别出来
 jieba.suggest_freq("年休假", tune=True)

 # 3将语句切分成单词
 seg_list = jieba.cut(string1, cut_all=False)

 f = "/".join(seg_list).encode("utf-8")
 f = f.decode("utf-8")
 print(f)
 # 4返回同义词替换后的句子
 final_sentence = " "
 for word in f.split('/'):
   if word in combine_dict:
     word = combine_dict[word]
     final_sentence += word
   else:
     final_sentence += word
 # print final_sentence
 return final_sentence


string1 = '年休到底放几天?'
print(replaceSynonymWords(string1))

结果

python同义词替换的实现(jieba分词)

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python爬虫入门教程之糗百图片爬虫代码分享
Sep 02 Python
Python中优化NumPy包使用性能的教程
Apr 23 Python
python删除列表内容
Aug 04 Python
详解Python3.6安装psutil模块和功能简介
May 30 Python
python散点图实例之随机漫步
Aug 27 Python
Python3获取拉勾网招聘信息的方法实例
Apr 03 Python
Linux上使用Python统计每天的键盘输入次数
Apr 17 Python
python使用opencv对图像mask处理的方法
Jul 05 Python
Python PyQt5 Pycharm 环境搭建及配置详解(图文教程)
Jul 16 Python
python实现邮件自动发送
Aug 10 Python
.img/.hdr格式转.nii格式的操作
Jul 01 Python
python flappy bird小游戏分步实现流程
Feb 15 Python
tensorflow模型保存、加载之变量重命名实例
Jan 21 #Python
tensorflow实现测试时读取任意指定的check point的网络参数
Jan 21 #Python
tensorflow如何继续训练之前保存的模型实例
Jan 21 #Python
在tensorflow中设置保存checkpoint的最大数量实例
Jan 21 #Python
TensorFlow——Checkpoint为模型添加检查点的实例
Jan 21 #Python
tensorflow estimator 使用hook实现finetune方式
Jan 21 #Python
Python实现FLV视频拼接功能
Jan 21 #Python
You might like
使用PHP计算两个路径的相对路径
2013/06/14 PHP
推荐25款php中非常有用的类库
2014/09/29 PHP
tp5框架使用composer实现日志记录功能示例
2019/01/10 PHP
JavaScript中的私有成员
2006/09/18 Javascript
JavaScript 编写匿名函数的几种方法
2010/02/21 Javascript
在jQuery1.5中使用deferred对象 着放大镜看Promise
2011/03/12 Javascript
js sort 二维数组排序的用法小结
2014/01/24 Javascript
使用Browserify配合jQuery进行编程的超级指南
2015/07/28 Javascript
JavaScript实现简单的日历效果
2016/09/25 Javascript
vue.js指令v-for使用及索引获取
2016/11/03 Javascript
微信小程序 Tab页切换更新数据
2017/01/05 Javascript
JavaScript 总结几个提高性能知识点(推荐)
2017/02/20 Javascript
Javascript中的getter和setter初识
2017/08/17 Javascript
react实现菜单权限控制的方法
2017/12/11 Javascript
详解刷新页面vuex数据不消失和不跳转页面的解决
2018/01/30 Javascript
Vue.js最佳实践(五招助你成为vuejs大师)
2018/05/04 Javascript
Element input树型下拉框的实现代码
2018/12/21 Javascript
JS中注入eval, Function等系统函数截获动态代码
2019/04/03 Javascript
JavaScript实现猜数字游戏
2020/05/20 Javascript
js实现飞机大战小游戏
2020/08/26 Javascript
[49:20]VG vs TNC Supermajor小组赛B组败者组决赛 BO3 第二场 6.2
2018/06/03 DOTA
[01:07:19]DOTA2-DPC中国联赛 正赛 CDEC vs XG BO3 第一场 1月19日
2021/03/11 DOTA
跟老齐学Python之总结参数的传递
2014/10/10 Python
Python中endswith()函数的基本使用
2015/04/07 Python
基于Python对象引用、可变性和垃圾回收详解
2017/08/21 Python
Python使用pickle模块报错EOFError Ran out of input的解决方法
2018/08/16 Python
python+ffmpeg批量去视频开头的方法
2019/01/09 Python
Python多进程写入同一文件的方法
2019/01/14 Python
Python 使用type来定义类的实现
2019/11/19 Python
python中把元组转换为namedtuple方法
2020/12/09 Python
一年级数学教学反思
2014/02/01 职场文书
大专生找工作自荐书
2014/06/10 职场文书
建筑工地文明标语
2014/10/09 职场文书
2015年安置帮教工作总结
2015/05/22 职场文书
天那边观后感
2015/06/09 职场文书
Python 机器学习工具包SKlearn的安装与使用
2021/05/14 Python