Python实现word2Vec model过程解析


Posted in Python onDecember 16, 2019

这篇文章主要介绍了Python实现word2Vec model过程解析,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下

import gensim, logging, os
logging.basicConfig(format='%(asctime)s : %(levelname)s : %(message)s', level=logging.INFO)
import nltk

corpus = nltk.corpus.brown.sents()

fname = 'brown_skipgram.model'
if os.path.exists(fname):
  # load the file if it has already been trained, to save repeating the slow training step below
  model = gensim.models.Word2Vec.load(fname)
else:
  # can take a few minutes, grab a cuppa
  model = gensim.models.Word2Vec(corpus, size=100, min_count=5, workers=2, iter=50)
  model.save(fname)

words = "woman women man girl boy green blue".split()
for w1 in words:
  for w2 in words:
    print(w1, w2, model.similarity(w1, w2))

print(model.most_similar(positive=['woman', ''], topn=1))
print(model.similarity('woman', 'girl'))girl

在gensim模块中已经封装了13年提出的model--word2vec,所以我们直接开始建立模型

Python实现word2Vec model过程解析

这是建立模型的过程,最后会出现saving Word2vec的语句,代表已经成功建立了模型

Python实现word2Vec model过程解析

这是输入了 gorvement和news关键词后 所反馈的词语 --- administration, 他们之间的相关性是0.508

当我在输入 women 和 man ,他们显示的相关性的0.638 ,已经是非常高的一个数字。

值得一提的是,我用的语料库是直接从nltk里的brown语料库。其中大概包括了一些新闻之类的数据。

大家如果感兴趣的话,可以自己建立该模型,通过传入不同的语料库,来calc 一些term的 相关性噢

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python里隐藏的“禅”
Jun 16 Python
零基础写python爬虫之urllib2中的两个重要概念:Openers和Handlers
Nov 05 Python
Python中有趣在__call__函数
Jun 21 Python
python 开发的三种运行模式详细介绍
Jan 18 Python
一步步教你用Python实现2048小游戏
Jan 19 Python
python中使用xlrd读excel使用xlwt写excel的实例代码
Jan 31 Python
Python实现求两个数组交集的方法示例
Feb 23 Python
python使用opencv在Windows下调用摄像头实现解析
Nov 26 Python
pytorch-RNN进行回归曲线预测方式
Jan 14 Python
Python实现对word文档添加密码去除密码的示例代码
Dec 29 Python
selenium+headless chrome爬虫的实现示例
Jan 08 Python
利用Python过滤相似文本的简单方法示例
Feb 03 Python
Python爬虫爬取煎蛋网图片代码实例
Dec 16 #Python
python实现监控阿里云账户余额功能
Dec 16 #Python
Python实现密码薄文件读写操作
Dec 16 #Python
如何基于Python实现电子邮件的发送
Dec 16 #Python
Python如何基于selenium实现自动登录博客园
Dec 16 #Python
Python正则表达式急速入门(小结)
Dec 16 #Python
如何基于Python制作有道翻译小工具
Dec 16 #Python
You might like
PHP 开源框架22个简单简介
2009/08/24 PHP
PHP序列号生成函数和字符串替换函数代码
2012/06/07 PHP
解析PHP工厂模式的好处
2013/06/18 PHP
php版淘宝网查询商品接口代码示例
2014/06/17 PHP
微信支付开发发货通知实例
2016/07/12 PHP
JS控制表格隔行变色
2006/06/26 Javascript
utf8的编码算法 转载
2006/12/27 Javascript
js模拟实现Array的sort方法
2007/12/11 Javascript
js 异步处理进度条
2010/04/01 Javascript
javascript拓展DOM操作 prependChild insertAfert
2010/11/17 Javascript
JavaScript生成GUID的多种算法小结
2013/08/18 Javascript
网站接入QQ登录的两种方法
2014/07/22 Javascript
JavaScript原型及原型链终极详解
2016/01/04 Javascript
安装使用Mongoose配合Node.js操作MongoDB的基础教程
2016/03/01 Javascript
jQuery点击其他地方时菜单消失的实现方法
2016/04/22 Javascript
AngularJS基础 ng-list 指令详解及示例代码
2016/08/02 Javascript
老生常谈JavaScript 正则表达式语法
2016/08/20 Javascript
jQuery插件ajaxFileUpload使用实例解析
2016/10/19 Javascript
JavaScript严格模式详解
2017/01/16 Javascript
vue 使用eventBus实现同级组件的通讯
2018/03/02 Javascript
jQuery实现表单动态添加数据并提交的方法
2018/07/19 jQuery
mpvue性能优化实战技巧(小结)
2019/04/17 Javascript
Element Backtop回到顶部的具体使用
2020/07/27 Javascript
python关闭windows进程的方法
2015/04/18 Python
Python3如何解决字符编码问题详解
2017/04/23 Python
Python实现字符串与数组相互转换功能示例
2017/09/22 Python
django 解决manage.py migrate无效的问题
2018/05/27 Python
python 实现批量xls文件转csv文件的方法
2018/10/23 Python
Python实现迪杰斯特拉算法过程解析
2020/09/18 Python
英国家庭家具、照明和花园家具购物网站:Furniture123
2018/12/31 全球购物
旅游管理毕业生自荐书
2014/02/02 职场文书
《临死前的严监生》教学反思
2014/02/13 职场文书
企业负责人任命书
2014/06/05 职场文书
开学第一周值周总结
2015/07/16 职场文书
2016年暑假学生家长评语
2015/12/01 职场文书
victoriaMetrics库布隆过滤器初始化及使用详解
2022/04/05 Golang