python同义词替换的实现(jieba分词)


Posted in Python onJanuary 21, 2020

TihuanWords.txt文档格式

注意:同一行的词用单个空格隔开,每行第一个词为同行词的替换词。

年休假 年假 年休
究竟 到底
回家场景 我回来了

代码

import jieba


def replaceSynonymWords(string1):
 # 1读取同义词表,并生成一个字典。
 combine_dict = {}
 # synonymWords.txt是同义词表,每行是一系列同义词,用空格分割
 for line in open("TihuanWords.txt", "r", encoding='utf-8'):
   seperate_word = line.strip().split(" ")
   num = len(seperate_word)
   for i in range(1, num):
     combine_dict[seperate_word[i]] = seperate_word[0]
   print(seperate_word)
 print(combine_dict)

 # 2提升某些词的词频,使其能够被jieba识别出来
 jieba.suggest_freq("年休假", tune=True)

 # 3将语句切分成单词
 seg_list = jieba.cut(string1, cut_all=False)

 f = "/".join(seg_list).encode("utf-8")
 f = f.decode("utf-8")
 print(f)
 # 4返回同义词替换后的句子
 final_sentence = " "
 for word in f.split('/'):
   if word in combine_dict:
     word = combine_dict[word]
     final_sentence += word
   else:
     final_sentence += word
 # print final_sentence
 return final_sentence


string1 = '年休到底放几天?'
print(replaceSynonymWords(string1))

结果

python同义词替换的实现(jieba分词)

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
利用python获得时间的实例说明
Mar 25 Python
python基础教程之基本内置数据类型介绍
Feb 20 Python
Python学生成绩管理系统简洁版
Apr 05 Python
python实现守护进程、守护线程、守护非守护并行
May 05 Python
Python将一个Excel拆分为多个Excel
Nov 07 Python
Python3 批量扫描端口的例子
Jul 25 Python
解决django服务器重启端口被占用的问题
Jul 26 Python
Pycharm中出现ImportError:DLL load failed:找不到指定模块的解决方法
Sep 17 Python
解决python cv2.imread 读取中文路径的图片返回为None的问题
Jun 02 Python
基于python 将列表作为参数传入函数时的测试与理解
Jun 05 Python
一文解决django 2.2与mysql兼容性问题
Jul 15 Python
15个应该掌握的Jupyter Notebook使用技巧(小结)
Sep 23 Python
tensorflow模型保存、加载之变量重命名实例
Jan 21 #Python
tensorflow实现测试时读取任意指定的check point的网络参数
Jan 21 #Python
tensorflow如何继续训练之前保存的模型实例
Jan 21 #Python
在tensorflow中设置保存checkpoint的最大数量实例
Jan 21 #Python
TensorFlow——Checkpoint为模型添加检查点的实例
Jan 21 #Python
tensorflow estimator 使用hook实现finetune方式
Jan 21 #Python
Python实现FLV视频拼接功能
Jan 21 #Python
You might like
php获取指定日期之间的各个周和月的起止时间
2014/11/24 PHP
thinkPHP模板引擎用法示例
2016/12/08 PHP
laravel框架如何设置公共头和公共尾
2019/10/22 PHP
HR vs CL BO3 第二场 2.13
2021/03/10 DOTA
详解jQuery插件开发中的extend方法
2013/11/19 Javascript
JavaScript中一个奇葩的IE浏览器判断方法
2014/04/16 Javascript
jquery模拟进度条实现方法
2015/08/03 Javascript
使用jquery+CSS3实现仿windows10开始菜单的下拉导航菜单特效
2015/09/24 Javascript
基于JQuery打造无缝滚动新闻步骤详解
2016/03/31 Javascript
详解Vue 普通对象数据更新与 file 对象数据更新
2017/04/26 Javascript
js绑定事件和解绑事件
2017/04/27 Javascript
vue 实现剪裁图片并上传服务器功能
2018/03/01 Javascript
Vue2.0实现调用摄像头进行拍照功能 exif.js实现图片上传功能
2018/04/28 Javascript
axios封装,使用拦截器统一处理接口,超详细的教程(推荐)
2019/05/02 Javascript
Vue中全局变量的定义和使用
2019/06/05 Javascript
JavaScript 替换所有匹配内容及正则替换方法
2020/02/12 Javascript
解决Vue + Echarts 使用markLine标线(precision精度问题)
2020/07/20 Javascript
Electron+vue从零开始打造一个本地播放器的方法示例
2020/10/27 Javascript
[44:51]2018DOTA2亚洲邀请赛 4.4 淘汰赛 VP vs Liquid 第二场
2018/04/05 DOTA
[57:37]EG vs Mineski 2018国际邀请赛小组赛BO2 第二场 8.16
2018/08/17 DOTA
Windows下Eclipse+PyDev配置Python+PyQt4开发环境
2016/05/17 Python
python 类详解及简单实例
2017/03/24 Python
使用Turtle画正螺旋线的方法
2017/09/22 Python
python 实现登录网页的操作方法
2018/05/11 Python
python爬虫开发之selenium模块详细使用方法与实例全解
2020/03/09 Python
python实现超级玛丽游戏
2020/03/18 Python
python实现批量命名照片
2020/06/18 Python
pycharm中使用request和Pytest进行接口测试的方法
2020/07/31 Python
欧洲最大的拼图游戏商店:JigsawPuzzle.co.uk
2018/07/04 全球购物
外贸主管求职简历的自我评价
2013/10/23 职场文书
城管大队整治方案
2014/05/06 职场文书
运动会演讲稿
2014/05/07 职场文书
2014年会计工作总结
2014/11/27 职场文书
信息技术教研组工作总结
2015/08/13 职场文书
诚信高考倡议书
2019/06/24 职场文书
python opencv将多个图放在一个窗口的实例详解
2022/02/28 Python