Python实现word2Vec model过程解析


Posted in Python onDecember 16, 2019

这篇文章主要介绍了Python实现word2Vec model过程解析,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下

import gensim, logging, os
logging.basicConfig(format='%(asctime)s : %(levelname)s : %(message)s', level=logging.INFO)
import nltk

corpus = nltk.corpus.brown.sents()

fname = 'brown_skipgram.model'
if os.path.exists(fname):
  # load the file if it has already been trained, to save repeating the slow training step below
  model = gensim.models.Word2Vec.load(fname)
else:
  # can take a few minutes, grab a cuppa
  model = gensim.models.Word2Vec(corpus, size=100, min_count=5, workers=2, iter=50)
  model.save(fname)

words = "woman women man girl boy green blue".split()
for w1 in words:
  for w2 in words:
    print(w1, w2, model.similarity(w1, w2))

print(model.most_similar(positive=['woman', ''], topn=1))
print(model.similarity('woman', 'girl'))girl

在gensim模块中已经封装了13年提出的model--word2vec,所以我们直接开始建立模型

Python实现word2Vec model过程解析

这是建立模型的过程,最后会出现saving Word2vec的语句,代表已经成功建立了模型

Python实现word2Vec model过程解析

这是输入了 gorvement和news关键词后 所反馈的词语 --- administration, 他们之间的相关性是0.508

当我在输入 women 和 man ,他们显示的相关性的0.638 ,已经是非常高的一个数字。

值得一提的是,我用的语料库是直接从nltk里的brown语料库。其中大概包括了一些新闻之类的数据。

大家如果感兴趣的话,可以自己建立该模型,通过传入不同的语料库,来calc 一些term的 相关性噢

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python中字符串对齐方法介绍
May 21 Python
Django中ORM表的创建和增删改查方法示例
Nov 15 Python
python 将list转成字符串,中间用符号分隔的方法
Oct 23 Python
Python Series从0开始索引的方法
Nov 06 Python
selenium3+python3环境搭建教程图解
Dec 07 Python
Python Unittest根据不同测试环境跳过用例的方法
Dec 16 Python
pytorch使用 to 进行类型转换方式
Jan 08 Python
Python 实现加密过的PDF文件转WORD格式
Feb 04 Python
python实现图像全景拼接
Mar 27 Python
Python Web项目Cherrypy使用方法镜像
Nov 05 Python
基于python模拟bfs和dfs代码实例
Nov 19 Python
python 批量下载bilibili视频的gui程序
Nov 20 Python
Python爬虫爬取煎蛋网图片代码实例
Dec 16 #Python
python实现监控阿里云账户余额功能
Dec 16 #Python
Python实现密码薄文件读写操作
Dec 16 #Python
如何基于Python实现电子邮件的发送
Dec 16 #Python
Python如何基于selenium实现自动登录博客园
Dec 16 #Python
Python正则表达式急速入门(小结)
Dec 16 #Python
如何基于Python制作有道翻译小工具
Dec 16 #Python
You might like
用PHP和ACCESS写聊天室(六)
2006/10/09 PHP
PHP分页显示制作详细讲解
2006/12/05 PHP
Yii 访问 Gii(脚手架)时出现 403 错误
2018/06/06 PHP
Jquery+JSon 无刷新分页实现代码
2010/04/01 Javascript
使用JavaScript构建JSON格式字符串实现步骤
2013/03/22 Javascript
javascript标签在页面中的位置探讨
2013/04/11 Javascript
javascript生成大小写字母
2015/07/03 Javascript
解决jquery实现的radio重新选中的问题
2015/07/03 Javascript
JQuery中解决重复动画的方法
2016/10/17 Javascript
利用JS实现页面删除并重新排序功能
2016/12/09 Javascript
javascript 使用正则test( )第一次是 true,第二次是false
2017/02/22 Javascript
JavaScript数据结构之二叉树的计数算法示例
2017/04/13 Javascript
推荐VSCode 上特别好用的 Vue 插件之vetur
2017/09/14 Javascript
AngularJS 的$timeout服务示例代码
2017/09/21 Javascript
详解webpack性能优化——DLL
2017/10/20 Javascript
layui添加动态菜单与选项卡 AJAX请求的例子
2019/09/25 Javascript
python文件读写并使用mysql批量插入示例分享(python操作mysql)
2014/02/17 Python
Python访问纯真IP数据库脚本分享
2015/06/29 Python
python如何发布自已pip项目的方法步骤
2018/10/09 Python
在python中只选取列表中某一纵列的方法
2018/11/28 Python
Python小白必备的8个最常用的内置函数(推荐)
2019/04/03 Python
python实现名片管理器的示例代码
2019/12/17 Python
如何在django中添加日志功能
2020/02/06 Python
PyCharm设置Ipython交互环境和宏快捷键进行数据分析图文详解
2020/04/23 Python
Python脚本实现监听服务器的思路代码详解
2020/05/28 Python
css3弹性盒子flex实现三栏布局的实现
2020/11/12 HTML / CSS
StubHub美国:购买或出售您的门票
2019/07/09 全球购物
Ellesse英国官网:意大利高级运动品牌
2019/07/23 全球购物
女子职高个人自荐书
2014/02/01 职场文书
晨会主持词
2014/03/17 职场文书
企业年会主持词
2014/03/27 职场文书
班主任个人工作反思
2014/04/28 职场文书
2014组织生活会方案
2014/05/19 职场文书
公司领导班子群众路线四风问题对照检查材料
2014/10/02 职场文书
秋季运动会加油词
2015/07/18 职场文书
MySQL系列之十三 MySQL的复制
2021/07/02 MySQL