Python实现word2Vec model过程解析


Posted in Python onDecember 16, 2019

这篇文章主要介绍了Python实现word2Vec model过程解析,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下

import gensim, logging, os
logging.basicConfig(format='%(asctime)s : %(levelname)s : %(message)s', level=logging.INFO)
import nltk

corpus = nltk.corpus.brown.sents()

fname = 'brown_skipgram.model'
if os.path.exists(fname):
  # load the file if it has already been trained, to save repeating the slow training step below
  model = gensim.models.Word2Vec.load(fname)
else:
  # can take a few minutes, grab a cuppa
  model = gensim.models.Word2Vec(corpus, size=100, min_count=5, workers=2, iter=50)
  model.save(fname)

words = "woman women man girl boy green blue".split()
for w1 in words:
  for w2 in words:
    print(w1, w2, model.similarity(w1, w2))

print(model.most_similar(positive=['woman', ''], topn=1))
print(model.similarity('woman', 'girl'))girl

在gensim模块中已经封装了13年提出的model--word2vec,所以我们直接开始建立模型

Python实现word2Vec model过程解析

这是建立模型的过程,最后会出现saving Word2vec的语句,代表已经成功建立了模型

Python实现word2Vec model过程解析

这是输入了 gorvement和news关键词后 所反馈的词语 --- administration, 他们之间的相关性是0.508

当我在输入 women 和 man ,他们显示的相关性的0.638 ,已经是非常高的一个数字。

值得一提的是,我用的语料库是直接从nltk里的brown语料库。其中大概包括了一些新闻之类的数据。

大家如果感兴趣的话,可以自己建立该模型,通过传入不同的语料库,来calc 一些term的 相关性噢

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
基于wxpython开发的简单gui计算器实例
May 30 Python
django框架如何集成celery进行开发
May 24 Python
Python向日志输出中添加上下文信息
May 24 Python
Python 私有函数的实例详解
Sep 11 Python
使用Pandas将inf, nan转化成特定的值
Dec 19 Python
如何更换python默认编辑器的背景色
Aug 10 Python
Idea安装python显示无SDK问题解决方案
Aug 12 Python
通过代码实例解析Pytest运行流程
Aug 20 Python
Python filter()及reduce()函数使用方法解析
Sep 05 Python
详解python实现可视化的MD5、sha256哈希加密小工具
Sep 14 Python
python 爬取哔哩哔哩up主信息和投稿视频
Jun 07 Python
Python Pygame实战在打砖块游戏的实现
Mar 17 Python
Python爬虫爬取煎蛋网图片代码实例
Dec 16 #Python
python实现监控阿里云账户余额功能
Dec 16 #Python
Python实现密码薄文件读写操作
Dec 16 #Python
如何基于Python实现电子邮件的发送
Dec 16 #Python
Python如何基于selenium实现自动登录博客园
Dec 16 #Python
Python正则表达式急速入门(小结)
Dec 16 #Python
如何基于Python制作有道翻译小工具
Dec 16 #Python
You might like
php计算给定时间之前的函数用法实例
2015/04/03 PHP
yii实现使用CUploadedFile上传文件的方法
2015/12/28 PHP
PHP文件上传之多文件上传的实现思路
2016/01/27 PHP
zen_cart实现支付前生成订单的方法
2016/05/06 PHP
php数据访问之增删改查操作
2016/05/09 PHP
总结对比php中的多种序列化
2016/08/28 PHP
AlertBox 弹出层信息提示框效果实现步骤
2010/10/11 Javascript
js,jQuery 排序的实现代码,网页标签排序的实现,标签排序
2011/04/27 Javascript
jQuery获得包含margin的outerWidth和outerHeight的方法
2015/03/25 Javascript
简介JavaScript中的setTime()方法的使用
2015/06/11 Javascript
如何使用jQuery技术开发ios风格的页面导航菜单
2015/07/29 Javascript
纯javascript实现图片延时加载方法
2015/08/21 Javascript
javascript自动恢复文本框点击清除后的默认文本
2016/01/12 Javascript
jQuery实现查找链接文字替换属性的方法
2016/06/27 Javascript
JS实现合并json对象的方法
2017/10/10 Javascript
JavaScript登录验证基础教程
2017/11/01 Javascript
关于JS解构的5种有趣用法
2019/09/05 Javascript
JavaScript原型继承和原型链原理详解
2020/02/04 Javascript
[03:59]5分钟带你了解什么是DOTA2(第二期)
2017/02/07 DOTA
跟老齐学Python之集合(set)
2014/09/24 Python
Python实现将doc转化pdf格式文档的方法
2018/01/19 Python
对python_discover方法遍历所有执行的用例详解
2019/02/13 Python
Python文件打开方式实例详解【a、a+、r+、w+区别】
2019/03/30 Python
Python中字符串String的基本内置函数与过滤字符模块函数的基本用法
2019/05/27 Python
python按修改时间顺序排列文件的实例代码
2019/07/25 Python
python实现对图片进行旋转,放缩,裁剪的功能
2019/08/07 Python
python中四舍五入的正确打开方式
2021/01/18 Python
详解如何在css3打包后自动追加前缀插件:autoprefixer
2018/12/18 HTML / CSS
几个人围成一圈的问题
2013/09/26 面试题
亲属关系公证书
2014/04/08 职场文书
圣诞节活动策划方案
2014/06/09 职场文书
工作期间打牌检讨书范文
2014/11/20 职场文书
2015清明节祭奠英烈寄语大全
2015/03/04 职场文书
《秋天的图画》教学反思
2016/02/19 职场文书
党风廉政建设心得体会
2019/05/21 职场文书
Redis实战高并发之扣减库存项目
2022/04/14 Redis