Python实现word2Vec model过程解析


Posted in Python onDecember 16, 2019

这篇文章主要介绍了Python实现word2Vec model过程解析,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下

import gensim, logging, os
logging.basicConfig(format='%(asctime)s : %(levelname)s : %(message)s', level=logging.INFO)
import nltk

corpus = nltk.corpus.brown.sents()

fname = 'brown_skipgram.model'
if os.path.exists(fname):
  # load the file if it has already been trained, to save repeating the slow training step below
  model = gensim.models.Word2Vec.load(fname)
else:
  # can take a few minutes, grab a cuppa
  model = gensim.models.Word2Vec(corpus, size=100, min_count=5, workers=2, iter=50)
  model.save(fname)

words = "woman women man girl boy green blue".split()
for w1 in words:
  for w2 in words:
    print(w1, w2, model.similarity(w1, w2))

print(model.most_similar(positive=['woman', ''], topn=1))
print(model.similarity('woman', 'girl'))girl

在gensim模块中已经封装了13年提出的model--word2vec,所以我们直接开始建立模型

Python实现word2Vec model过程解析

这是建立模型的过程,最后会出现saving Word2vec的语句,代表已经成功建立了模型

Python实现word2Vec model过程解析

这是输入了 gorvement和news关键词后 所反馈的词语 --- administration, 他们之间的相关性是0.508

当我在输入 women 和 man ,他们显示的相关性的0.638 ,已经是非常高的一个数字。

值得一提的是,我用的语料库是直接从nltk里的brown语料库。其中大概包括了一些新闻之类的数据。

大家如果感兴趣的话,可以自己建立该模型,通过传入不同的语料库,来calc 一些term的 相关性噢

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python通过urllib2爬网页上种子下载示例
Feb 24 Python
Pycharm远程调试openstack的方法
Nov 21 Python
5个很好的Python面试题问题答案及分析
Jan 19 Python
Python操作MySQL模拟银行转账
Mar 12 Python
Django框架表单操作实例分析
Nov 04 Python
在python中利用dict转json按输入顺序输出内容方式
Feb 27 Python
python的json包位置及用法总结
Jun 21 Python
python UIAutomator2使用超详细教程
Feb 19 Python
Python3 使用pip安装git并获取Yahoo金融数据的操作
Apr 08 Python
opencv读取视频并保存图像的方法
Jun 04 Python
python3+PyQt5+Qt Designer实现界面可视化
Jun 10 Python
python编程学习使用管道Pipe编写优化代码
Nov 20 Python
Python爬虫爬取煎蛋网图片代码实例
Dec 16 #Python
python实现监控阿里云账户余额功能
Dec 16 #Python
Python实现密码薄文件读写操作
Dec 16 #Python
如何基于Python实现电子邮件的发送
Dec 16 #Python
Python如何基于selenium实现自动登录博客园
Dec 16 #Python
Python正则表达式急速入门(小结)
Dec 16 #Python
如何基于Python制作有道翻译小工具
Dec 16 #Python
You might like
常用表单验证类,有了这个,一般的验证就都齐了。
2006/12/06 PHP
php实现Mongodb自定义方式生成自增ID的方法
2015/03/23 PHP
php生成唯一数字id的方法汇总
2015/11/18 PHP
php简单的上传类分享
2016/05/15 PHP
PHP读MYSQL中文乱码的快速解决方法
2016/10/01 PHP
PHP实现的基于单向链表解决约瑟夫环问题示例
2017/09/30 PHP
解决laravel查询构造器中的别名问题
2019/10/17 PHP
laravel通用化的CURD的实现
2019/12/13 PHP
三种方式获取XMLHttpRequest对象
2014/04/21 Javascript
Javascript 绘制 sin 曲线过程附图
2014/08/21 Javascript
JavaScript如何实现组合列表框中元素移动效果
2016/03/01 Javascript
jQuery针对input的class属性写了多个值情况下的选择方法
2016/06/03 Javascript
JQuery获取鼠标进入和离开容器的方向
2016/12/29 Javascript
jQuery实现的表格前端排序功能示例
2017/09/18 jQuery
在 Vue-CLI 中引入 simple-mock实现简易的 API Mock 接口数据模拟
2018/11/28 Javascript
vue+element tabs选项卡分页效果
2020/06/29 Javascript
[03:31]DOTA2英雄基础教程 大地之灵
2013/12/17 DOTA
[00:34]DOTA2上海特级锦标赛 VG战队宣传片
2016/03/04 DOTA
Python Web框架Flask下网站开发入门实例
2015/02/08 Python
python超简单解决约瑟夫环问题
2015/05/12 Python
python的paramiko模块实现远程控制和传输示例
2017/10/13 Python
Python 实现微信防撤回功能
2019/04/29 Python
python制作填词游戏步骤详解
2019/05/05 Python
文员岗位职责
2013/11/09 职场文书
建筑施工员岗位职责
2013/11/26 职场文书
教师应聘个人求职信
2013/12/10 职场文书
八项规定整改措施
2014/02/12 职场文书
拾金不昧表扬信
2015/01/16 职场文书
感恩节寄语2015
2015/03/24 职场文书
2015年学校工作总结范文
2015/04/20 职场文书
2015年领导干部廉洁自律工作总结
2015/05/26 职场文书
小学校长开学致辞
2015/07/29 职场文书
2016年优秀教师先进事迹材料
2016/02/26 职场文书
Go语言-为什么返回值为接口类型,却返回结构体
2021/04/24 Golang
Mysql实现简易版搜索引擎的示例代码
2021/08/30 MySQL
Redis批量生成数据的实现
2022/06/05 Redis