python同义词替换的实现(jieba分词)


Posted in Python onJanuary 21, 2020

TihuanWords.txt文档格式

注意:同一行的词用单个空格隔开,每行第一个词为同行词的替换词。

年休假 年假 年休
究竟 到底
回家场景 我回来了

代码

import jieba


def replaceSynonymWords(string1):
 # 1读取同义词表,并生成一个字典。
 combine_dict = {}
 # synonymWords.txt是同义词表,每行是一系列同义词,用空格分割
 for line in open("TihuanWords.txt", "r", encoding='utf-8'):
   seperate_word = line.strip().split(" ")
   num = len(seperate_word)
   for i in range(1, num):
     combine_dict[seperate_word[i]] = seperate_word[0]
   print(seperate_word)
 print(combine_dict)

 # 2提升某些词的词频,使其能够被jieba识别出来
 jieba.suggest_freq("年休假", tune=True)

 # 3将语句切分成单词
 seg_list = jieba.cut(string1, cut_all=False)

 f = "/".join(seg_list).encode("utf-8")
 f = f.decode("utf-8")
 print(f)
 # 4返回同义词替换后的句子
 final_sentence = " "
 for word in f.split('/'):
   if word in combine_dict:
     word = combine_dict[word]
     final_sentence += word
   else:
     final_sentence += word
 # print final_sentence
 return final_sentence


string1 = '年休到底放几天?'
print(replaceSynonymWords(string1))

结果

python同义词替换的实现(jieba分词)

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
删除目录下相同文件的python代码(逐级优化)
May 25 Python
重命名批处理python脚本
Apr 05 Python
Python脚本实现格式化css文件
Apr 08 Python
Windows下PyMongo下载及安装教程
Apr 27 Python
不同版本中Python matplotlib.pyplot.draw()界面绘制异常问题的解决
Sep 24 Python
Python实现两款计算器功能示例
Dec 19 Python
机器学习经典算法-logistic回归代码详解
Dec 22 Python
Python下载网络文本数据到本地内存的四种实现方法示例
Feb 05 Python
python连接mongodb集群方法详解
Feb 13 Python
Python random库使用方法及异常处理方案
Mar 02 Python
python 绘制正态曲线的示例
Sep 24 Python
Python中npy和mat文件的保存与读取
Apr 24 Python
tensorflow模型保存、加载之变量重命名实例
Jan 21 #Python
tensorflow实现测试时读取任意指定的check point的网络参数
Jan 21 #Python
tensorflow如何继续训练之前保存的模型实例
Jan 21 #Python
在tensorflow中设置保存checkpoint的最大数量实例
Jan 21 #Python
TensorFlow——Checkpoint为模型添加检查点的实例
Jan 21 #Python
tensorflow estimator 使用hook实现finetune方式
Jan 21 #Python
Python实现FLV视频拼接功能
Jan 21 #Python
You might like
php自定义的格式化时间示例代码
2013/12/05 PHP
Javascript实例教程(19) 使用HoTMetal(6)
2006/12/23 Javascript
JQuery优缺点分析说明
2010/06/09 Javascript
获得所有表单值的JQuery实现代码[IE暂不支持]
2012/05/24 Javascript
文本框input聚焦失焦样式实现代码
2012/10/12 Javascript
jQuery.clean使用方法及思路分析
2013/01/07 Javascript
JS去除右边逗号的简单方法
2013/07/03 Javascript
一个判断抢购时间是否到达的简单的js函数
2014/06/23 Javascript
JQuery 设置checkbox值二次无效的解决方法
2016/07/22 Javascript
js编写三级联动简单案例
2016/12/21 Javascript
基于JavaScript实现熔岩灯效果导航菜单
2017/01/04 Javascript
vue-cli入门之项目结构分析
2017/04/20 Javascript
微信小程序图片选择、上传到服务器、预览(PHP)实现实例
2017/05/11 Javascript
微信小程序mpvue点击按钮获取button值的方法
2019/05/29 Javascript
Vue 实现创建全局组件,并且使用Vue.use() 载入方式
2020/08/11 Javascript
[01:52]2014DOTA2西雅图邀请赛 V社开大会你不知道的小秘密
2014/07/08 DOTA
[02:33]DOTA2亚洲邀请赛趣味视频之吐真话筒
2018/03/31 DOTA
Python2中的raw_input() 与 input()
2015/06/12 Python
Python基于pygame实现的弹力球效果(附源码)
2015/11/11 Python
python文件与目录操作实例详解
2016/02/22 Python
Python3之简单搭建自带服务器的实例讲解
2018/06/04 Python
python3利用ctypes传入一个字符串类型的列表方法
2019/02/12 Python
python如何把字符串类型list转换成list
2020/02/18 Python
Django实现celery定时任务过程解析
2020/04/21 Python
Python selenium 加载并保存QQ群成员,去除其群主、管理员信息的示例代码
2020/05/28 Python
使用CSS3编写灰阶滤镜来制作黑白照片效果的方法
2016/05/09 HTML / CSS
HTML5是什么 HTML5是什么意思 HTML5简介
2012/10/26 HTML / CSS
Bally澳大利亚官网:瑞士奢侈品牌
2018/11/01 全球购物
俄罗斯花园种植材料批发和零售网上商店:Беккер
2019/07/22 全球购物
华为慧通面试题
2012/09/11 面试题
出纳岗位职责
2013/11/09 职场文书
赞美老师的演讲稿
2014/05/22 职场文书
祖国在我心中演讲稿600字
2014/09/23 职场文书
计划生育诚信协议书
2014/11/02 职场文书
2015年九一八事变纪念活动实施方案
2015/05/06 职场文书
趣味运动会新闻稿
2015/07/17 职场文书