Python实现word2Vec model过程解析


Posted in Python onDecember 16, 2019

这篇文章主要介绍了Python实现word2Vec model过程解析,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下

import gensim, logging, os
logging.basicConfig(format='%(asctime)s : %(levelname)s : %(message)s', level=logging.INFO)
import nltk

corpus = nltk.corpus.brown.sents()

fname = 'brown_skipgram.model'
if os.path.exists(fname):
  # load the file if it has already been trained, to save repeating the slow training step below
  model = gensim.models.Word2Vec.load(fname)
else:
  # can take a few minutes, grab a cuppa
  model = gensim.models.Word2Vec(corpus, size=100, min_count=5, workers=2, iter=50)
  model.save(fname)

words = "woman women man girl boy green blue".split()
for w1 in words:
  for w2 in words:
    print(w1, w2, model.similarity(w1, w2))

print(model.most_similar(positive=['woman', ''], topn=1))
print(model.similarity('woman', 'girl'))girl

在gensim模块中已经封装了13年提出的model--word2vec,所以我们直接开始建立模型

Python实现word2Vec model过程解析

这是建立模型的过程,最后会出现saving Word2vec的语句,代表已经成功建立了模型

Python实现word2Vec model过程解析

这是输入了 gorvement和news关键词后 所反馈的词语 --- administration, 他们之间的相关性是0.508

当我在输入 women 和 man ,他们显示的相关性的0.638 ,已经是非常高的一个数字。

值得一提的是,我用的语料库是直接从nltk里的brown语料库。其中大概包括了一些新闻之类的数据。

大家如果感兴趣的话,可以自己建立该模型,通过传入不同的语料库,来calc 一些term的 相关性噢

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python模块restful使用方法实例
Dec 10 Python
python执行等待程序直到第二天零点的方法
Apr 23 Python
使用Python对Excel进行读写操作
Mar 30 Python
Tensorflow环境搭建的方法步骤
Feb 07 Python
用Python将mysql数据导出成json的方法
Aug 21 Python
Python图像处理之直线和曲线的拟合与绘制【curve_fit()应用】
Dec 26 Python
解决.ui文件生成的.py文件运行不出现界面的方法
Jun 19 Python
python递归法解决棋盘分割问题
Jul 17 Python
Tensorflow模型实现预测或识别单张图片
Jul 19 Python
基于Python解密仿射密码
Oct 21 Python
Python序列类型的打包和解包实例
Dec 21 Python
Python os和os.path模块详情
Apr 02 Python
Python爬虫爬取煎蛋网图片代码实例
Dec 16 #Python
python实现监控阿里云账户余额功能
Dec 16 #Python
Python实现密码薄文件读写操作
Dec 16 #Python
如何基于Python实现电子邮件的发送
Dec 16 #Python
Python如何基于selenium实现自动登录博客园
Dec 16 #Python
Python正则表达式急速入门(小结)
Dec 16 #Python
如何基于Python制作有道翻译小工具
Dec 16 #Python
You might like
基于php-fpm的配置详解
2013/06/03 PHP
Thinkphp中import的几个用法详细介绍
2014/07/02 PHP
php中删除、清空session的方式总结
2015/10/09 PHP
CI框架支持$_GET的两种实现方法
2016/05/18 PHP
Laravel4中的Validator验证扩展用法详解
2016/07/26 PHP
CI框架(CodeIgniter)操作redis的方法详解
2018/01/25 PHP
改变javascript函数内部this指针指向的三种方法
2010/04/23 Javascript
zShowBox 图片放大展示jquery版 兼容性
2011/09/24 Javascript
基于jquery的多功能软键盘插件
2012/07/25 Javascript
当鼠标滑过文本框自动选中输入框内容的JS代码分享
2013/11/26 Javascript
ext combobox动态加载数据库数据(附前后台)
2014/06/17 Javascript
JavaScript判断表单提交时哪个radio按钮被选中的方法
2015/03/21 Javascript
jQuery实现右键菜单、遮罩等效果代码
2016/09/27 Javascript
JS实现探测网站链接的方法【测试可用】
2016/11/08 Javascript
手机端js和html5刮刮卡效果
2020/09/29 Javascript
微信小程序中显示html格式内容的方法
2017/04/25 Javascript
angularjs中ng-bind-html的用法总结
2017/05/23 Javascript
[42:25]2018DOTA2亚洲邀请赛 4.5 淘汰赛 LGD vs Liquid 第三场
2018/04/06 DOTA
python命令行参数sys.argv使用示例
2014/01/28 Python
numpy数组之存取文件的实现示例
2019/05/24 Python
python装饰器相当于函数的调用方式
2019/12/27 Python
Python列表去重复项的N种方法(实例代码)
2020/05/12 Python
python 瀑布线指标编写实例
2020/06/03 Python
Windows下PyCharm配置Anaconda环境(超详细教程)
2020/07/31 Python
PyQt5 QDockWidget控件应用详解
2020/08/12 Python
websocket+sockjs+stompjs详解及实例代码
2018/11/30 HTML / CSS
探究 canvas 绘图中撤销(undo)功能的实现方式详解
2018/05/17 HTML / CSS
Lulu Guinness露露·吉尼斯官网:红唇包
2019/02/03 全球购物
大三学生入党思想汇报
2014/01/02 职场文书
群众路线剖析材料
2014/02/02 职场文书
信息技术课后反思
2014/04/27 职场文书
毕业典礼演讲稿
2014/05/13 职场文书
汽修专业自荐信
2014/07/07 职场文书
2014年营业员工作总结
2014/11/18 职场文书
2014员工聘用协议书(最新版)
2014/11/24 职场文书
综合办公室岗位职责
2015/04/11 职场文书