编程 Python

Python实现word2Vec model过程解析

Posted in Python onDecember 16, 2019

这篇文章主要介绍了Python实现word2Vec model过程解析,文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下

import gensim, logging, os
logging.basicConfig(format='%(asctime)s : %(levelname)s : %(message)s', level=logging.INFO)
import nltk

corpus = nltk.corpus.brown.sents()

fname = 'brown_skipgram.model'
if os.path.exists(fname):
  # load the file if it has already been trained, to save repeating the slow training step below
  model = gensim.models.Word2Vec.load(fname)
else:
  # can take a few minutes, grab a cuppa
  model = gensim.models.Word2Vec(corpus, size=100, min_count=5, workers=2, iter=50)
  model.save(fname)

words = "woman women man girl boy green blue".split()
for w1 in words:
  for w2 in words:
    print(w1, w2, model.similarity(w1, w2))

print(model.most_similar(positive=['woman', ''], topn=1))
print(model.similarity('woman', 'girl'))girl

在gensim模块中已经封装了13年提出的model--word2vec，所以我们直接开始建立模型

这是建立模型的过程，最后会出现saving Word2vec的语句，代表已经成功建立了模型

Python实现word2Vec model过程解析

这是输入了 gorvement和news关键词后所反馈的词语 --- administration，他们之间的相关性是0.508

当我在输入 women 和 man ，他们显示的相关性的0.638 ，已经是非常高的一个数字。

值得一提的是，我用的语料库是直接从nltk里的brown语料库。其中大概包括了一些新闻之类的数据。

大家如果感兴趣的话，可以自己建立该模型，通过传入不同的语料库，来calc 一些term的相关性噢

以上就是本文的全部内容，希望对大家的学习有所帮助，也希望大家多多支持三水点靠木。

Python实现word2Vec model过程解析

- Author -

Leslie_Chan

声明：登载此文出于传递更多信息之目的，并不意味着赞同其观点或证实其描述。

Python 相关文章推荐

python通过urllib2爬网页上种子下载示例

Feb 24 Python

Pycharm远程调试openstack的方法

Nov 21 Python

5个很好的Python面试题问题答案及分析

Jan 19 Python

Python操作MySQL模拟银行转账

Mar 12 Python

Django框架表单操作实例分析

Nov 04 Python

在python中利用dict转json按输入顺序输出内容方式

Feb 27 Python

python的json包位置及用法总结

Jun 21 Python

python UIAutomator2使用超详细教程

Feb 19 Python

Python3 使用pip安装git并获取Yahoo金融数据的操作

Apr 08 Python

opencv读取视频并保存图像的方法

Jun 04 Python

python3+PyQt5+Qt Designer实现界面可视化

Jun 10 Python

python编程学习使用管道Pipe编写优化代码

Nov 20 Python

Python爬虫爬取煎蛋网图片代码实例

Dec 16 #Python

python实现监控阿里云账户余额功能

Dec 16 #Python

Python实现密码薄文件读写操作

Dec 16 #Python

如何基于Python实现电子邮件的发送

Dec 16 #Python

Python如何基于selenium实现自动登录博客园

Dec 16 #Python

Python正则表达式急速入门(小结)

Dec 16 #Python

如何基于Python制作有道翻译小工具

Dec 16 #Python

You might like

常用表单验证类，有了这个，一般的验证就都齐了。

2006/12/06 PHP

php实现Mongodb自定义方式生成自增ID的方法

2015/03/23 PHP

php生成唯一数字id的方法汇总

2015/11/18 PHP

php简单的上传类分享

2016/05/15 PHP

PHP读MYSQL中文乱码的快速解决方法

2016/10/01 PHP

PHP实现的基于单向链表解决约瑟夫环问题示例

2017/09/30 PHP

解决laravel查询构造器中的别名问题

2019/10/17 PHP

laravel通用化的CURD的实现

2019/12/13 PHP

三种方式获取XMLHttpRequest对象

2014/04/21 Javascript

Javascript 绘制 sin 曲线过程附图

2014/08/21 Javascript

JavaScript如何实现组合列表框中元素移动效果

2016/03/01 Javascript

jQuery针对input的class属性写了多个值情况下的选择方法

2016/06/03 Javascript

JQuery获取鼠标进入和离开容器的方向

2016/12/29 Javascript

jQuery实现的表格前端排序功能示例

2017/09/18 jQuery

在 Vue-CLI 中引入 simple-mock实现简易的 API Mock 接口数据模拟

2018/11/28 Javascript

vue+element tabs选项卡分页效果

2020/06/29 Javascript

[03:31]DOTA2英雄基础教程大地之灵

2013/12/17 DOTA

[00:34]DOTA2上海特级锦标赛 VG战队宣传片

2016/03/04 DOTA

Python Web框架Flask下网站开发入门实例

2015/02/08 Python

python超简单解决约瑟夫环问题

2015/05/12 Python

python的paramiko模块实现远程控制和传输示例

2017/10/13 Python

Python 实现微信防撤回功能

2019/04/29 Python

python制作填词游戏步骤详解

2019/05/05 Python

文员岗位职责

2013/11/09 职场文书

建筑施工员岗位职责

2013/11/26 职场文书

教师应聘个人求职信

2013/12/10 职场文书

八项规定整改措施

2014/02/12 职场文书

拾金不昧表扬信

2015/01/16 职场文书

感恩节寄语2015

2015/03/24 职场文书

2015年学校工作总结范文

2015/04/20 职场文书

2015年领导干部廉洁自律工作总结

2015/05/26 职场文书

小学校长开学致辞

2015/07/29 职场文书

2016年优秀教师先进事迹材料

2016/02/26 职场文书

Go语言-为什么返回值为接口类型,却返回结构体

2021/04/24 Golang

Mysql实现简易版搜索引擎的示例代码

2021/08/30 MySQL

Redis批量生成数据的实现

2022/06/05 Redis