python同义词替换的实现(jieba分词)


Posted in Python onJanuary 21, 2020

TihuanWords.txt文档格式

注意:同一行的词用单个空格隔开,每行第一个词为同行词的替换词。

年休假 年假 年休
究竟 到底
回家场景 我回来了

代码

import jieba


def replaceSynonymWords(string1):
 # 1读取同义词表,并生成一个字典。
 combine_dict = {}
 # synonymWords.txt是同义词表,每行是一系列同义词,用空格分割
 for line in open("TihuanWords.txt", "r", encoding='utf-8'):
   seperate_word = line.strip().split(" ")
   num = len(seperate_word)
   for i in range(1, num):
     combine_dict[seperate_word[i]] = seperate_word[0]
   print(seperate_word)
 print(combine_dict)

 # 2提升某些词的词频,使其能够被jieba识别出来
 jieba.suggest_freq("年休假", tune=True)

 # 3将语句切分成单词
 seg_list = jieba.cut(string1, cut_all=False)

 f = "/".join(seg_list).encode("utf-8")
 f = f.decode("utf-8")
 print(f)
 # 4返回同义词替换后的句子
 final_sentence = " "
 for word in f.split('/'):
   if word in combine_dict:
     word = combine_dict[word]
     final_sentence += word
   else:
     final_sentence += word
 # print final_sentence
 return final_sentence


string1 = '年休到底放几天?'
print(replaceSynonymWords(string1))

结果

python同义词替换的实现(jieba分词)

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python在命令行下使用google翻译(带语音)
Jan 16 Python
用python实现对比两张图片的不同
Feb 05 Python
Python实现随机漫步功能
Jul 09 Python
pyqt5使用按钮进行界面的跳转方法
Jun 19 Python
django 数据库连接模块解析及简单长连接改造方法
Aug 29 Python
Python3实现将一维数组按标准长度分隔为二维数组
Nov 29 Python
flask框架渲染Jinja模板与传入模板变量操作详解
Jan 25 Python
Python更换pip源方法过程解析
May 19 Python
python中列表的含义及用法
May 26 Python
学python需要去培训机构吗
Jul 01 Python
Django修改app名称和数据表迁移方案实现
Sep 17 Python
Python爬虫定时计划任务的几种常见方法(推荐)
Jan 15 Python
tensorflow模型保存、加载之变量重命名实例
Jan 21 #Python
tensorflow实现测试时读取任意指定的check point的网络参数
Jan 21 #Python
tensorflow如何继续训练之前保存的模型实例
Jan 21 #Python
在tensorflow中设置保存checkpoint的最大数量实例
Jan 21 #Python
TensorFlow——Checkpoint为模型添加检查点的实例
Jan 21 #Python
tensorflow estimator 使用hook实现finetune方式
Jan 21 #Python
Python实现FLV视频拼接功能
Jan 21 #Python
You might like
Discuz Uchome ajaxpost小技巧
2011/01/04 PHP
php下通过curl抓取yahoo boss 搜索结果的实现代码
2011/06/10 PHP
php中检查文件或目录是否存在的代码小结
2012/10/22 PHP
thinkphp配置连接数据库技巧
2014/12/02 PHP
php给每个段落添加空格的方法
2015/03/20 PHP
PHP中的使用curl发送请求(GET请求和POST请求)
2017/02/08 PHP
Laravel框架定时任务2种实现方式示例
2018/12/08 PHP
JavaScript 开发中规范性的一点感想
2009/06/23 Javascript
关于Aptana Studio生成自动备份文件的解决办法
2009/12/23 Javascript
js 实现在离开页面时提醒未保存的信息(减少用户重复操作)
2013/01/16 Javascript
jQuery表格插件datatables用法总结
2014/09/05 Javascript
关于延迟加载JavaScript
2015/05/05 Javascript
JS实现图片上传预览功能
2016/11/21 Javascript
通过示例彻底搞懂js闭包
2017/08/10 Javascript
jquery 通过ajax请求获取后台数据显示在表格上的方法
2018/08/08 jQuery
vue 实现路由跳转时更改页面title
2019/11/05 Javascript
angular组件间传值测试的方法详解
2020/05/07 Javascript
ES6新增的数组知识实例小结
2020/05/23 Javascript
[06:16]DOTA2守卫传承者——职业选手谈心路历程
2015/02/26 DOTA
[01:01:23]完美世界DOTA2联赛PWL S2 Forest vs FTD.C 第一场 11.26
2020/11/30 DOTA
matplotlib简介,安装和简单实例代码
2017/12/26 Python
django框架中ajax的使用及避开CSRF 验证的方式详解
2019/12/11 Python
详解从Django Allauth中进行登录改造小结
2019/12/18 Python
Python如何使用turtle库绘制图形
2020/02/26 Python
python开发实例之python使用Websocket库开发简单聊天工具实例详解(python+Websocket+JS)
2020/03/18 Python
Python flask框架端口失效解决方案
2020/06/04 Python
HTML5之SVG 2D入门6—视窗坐标系与用户坐标系及变换概述
2013/01/30 HTML / CSS
JBL英国官网:JBL UK
2018/07/04 全球购物
俄罗斯首家面向中国消费者的一站式购物网站:Wruru
2020/05/08 全球购物
网络技术支持面试题
2013/04/22 面试题
幼儿园中秋节活动方案
2014/02/06 职场文书
奥运会口号
2014/06/13 职场文书
大学生职业生涯规划大赛作品(精品)
2014/09/17 职场文书
英语读书笔记
2015/07/02 职场文书
新年寄语2016
2015/08/17 职场文书
selenium.webdriver中add_argument方法常用参数表
2021/04/08 Python