Python实现word2Vec model过程解析


Posted in Python onDecember 16, 2019

这篇文章主要介绍了Python实现word2Vec model过程解析,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下

import gensim, logging, os
logging.basicConfig(format='%(asctime)s : %(levelname)s : %(message)s', level=logging.INFO)
import nltk

corpus = nltk.corpus.brown.sents()

fname = 'brown_skipgram.model'
if os.path.exists(fname):
  # load the file if it has already been trained, to save repeating the slow training step below
  model = gensim.models.Word2Vec.load(fname)
else:
  # can take a few minutes, grab a cuppa
  model = gensim.models.Word2Vec(corpus, size=100, min_count=5, workers=2, iter=50)
  model.save(fname)

words = "woman women man girl boy green blue".split()
for w1 in words:
  for w2 in words:
    print(w1, w2, model.similarity(w1, w2))

print(model.most_similar(positive=['woman', ''], topn=1))
print(model.similarity('woman', 'girl'))girl

在gensim模块中已经封装了13年提出的model--word2vec,所以我们直接开始建立模型

Python实现word2Vec model过程解析

这是建立模型的过程,最后会出现saving Word2vec的语句,代表已经成功建立了模型

Python实现word2Vec model过程解析

这是输入了 gorvement和news关键词后 所反馈的词语 --- administration, 他们之间的相关性是0.508

当我在输入 women 和 man ,他们显示的相关性的0.638 ,已经是非常高的一个数字。

值得一提的是,我用的语料库是直接从nltk里的brown语料库。其中大概包括了一些新闻之类的数据。

大家如果感兴趣的话,可以自己建立该模型,通过传入不同的语料库,来calc 一些term的 相关性噢

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python抓取豆瓣图片并自动保存示例学习
Jan 10 Python
Python实现代码统计工具(终极篇)
Jul 04 Python
使用python在本地电脑上快速处理数据
Jun 22 Python
Python如何实现MySQL实例初始化详解
Nov 06 Python
django主动抛出403异常的方法详解
Jan 04 Python
Python正则表达式和re库知识点总结
Feb 11 Python
Python正则表达式匹配和提取IP地址
Jun 06 Python
Django中使用session保持用户登陆连接的例子
Aug 06 Python
Python单元测试模块doctest的具体使用
Feb 10 Python
Matlab使用Plot函数实现数据动态显示方法总结
Feb 25 Python
pytorch 两个GPU同时训练的解决方案
Jun 01 Python
Pytorch DataLoader shuffle验证方式
Jun 02 Python
Python爬虫爬取煎蛋网图片代码实例
Dec 16 #Python
python实现监控阿里云账户余额功能
Dec 16 #Python
Python实现密码薄文件读写操作
Dec 16 #Python
如何基于Python实现电子邮件的发送
Dec 16 #Python
Python如何基于selenium实现自动登录博客园
Dec 16 #Python
Python正则表达式急速入门(小结)
Dec 16 #Python
如何基于Python制作有道翻译小工具
Dec 16 #Python
You might like
php 远程图片保存到本地的函数类
2008/12/08 PHP
php中file_exists函数使用详解
2015/05/08 PHP
PHP判断数组是否为空的常用方法(五种方法)
2017/02/08 PHP
PHP基于递归算法解决兔子生兔子问题
2018/05/11 PHP
Thinkphp页面跳转设置跳转等待时间的操作
2019/10/16 PHP
laravel框架创建授权策略实例分析
2019/11/22 PHP
php5.3/5.4/5.5/5.6/7常见新增特性汇总整理
2020/02/27 PHP
jquery 结合C#后台的数组对文章的关键字自动添加链接的代码
2011/07/15 Javascript
使用Grunt.js管理你项目的应用说明
2013/04/24 Javascript
js 输出内容到新窗口具体实现代码
2013/05/31 Javascript
原生JavaScript实现连连看游戏(附源码)
2013/11/05 Javascript
你未必知道的JavaScript和CSS交互的5种方法
2014/04/02 Javascript
TinyMCE汉化及本地上传图片功能实例详解
2016/05/31 Javascript
Windows环境下npm install 报错: operation not permitted, rename的解决方法
2016/09/26 Javascript
微信小程序中使元素占满整个屏幕高度实现方法
2016/12/14 Javascript
利用pm2部署多个node.js项目的配置教程
2017/10/22 Javascript
vue项目实现表单登录页保存账号和密码到cookie功能
2018/08/31 Javascript
JavaScript ES2019中的8个新特性详解
2019/02/20 Javascript
重置Redux的状态数据的方法实现
2019/11/18 Javascript
Vue + Scss 动态切换主题颜色实现换肤的示例代码
2020/04/27 Javascript
学习python (2)
2006/10/31 Python
用实例说明python的*args和**kwargs用法
2013/11/01 Python
Python中__name__的使用实例
2015/04/14 Python
python自动截取需要区域,进行图像识别的方法
2018/05/17 Python
python 实现对数据集的归一化的方法(0-1之间)
2018/07/17 Python
Django CBV与FBV原理及实例详解
2019/08/12 Python
使用Python实现分别输出每个数组
2019/12/06 Python
如何通过Python3和ssl实现加密通信功能
2020/05/09 Python
Python 使用office365邮箱的示例
2020/10/29 Python
使用bandit对目标python代码进行安全函数扫描的案例分析
2021/01/27 Python
css3通过scale()、rotate()实现放大、旋转
2020/03/19 HTML / CSS
连卡佛中国官网:Lane Crawford中文站
2018/01/27 全球购物
工厂厂长岗位职责
2013/11/08 职场文书
2015年学校精神文明工作总结
2015/05/27 职场文书
基于Redis位图实现用户签到功能
2021/05/08 Redis
Python装饰器详细介绍
2022/03/25 Python