Python实现word2Vec model过程解析


Posted in Python onDecember 16, 2019

这篇文章主要介绍了Python实现word2Vec model过程解析,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下

import gensim, logging, os
logging.basicConfig(format='%(asctime)s : %(levelname)s : %(message)s', level=logging.INFO)
import nltk

corpus = nltk.corpus.brown.sents()

fname = 'brown_skipgram.model'
if os.path.exists(fname):
  # load the file if it has already been trained, to save repeating the slow training step below
  model = gensim.models.Word2Vec.load(fname)
else:
  # can take a few minutes, grab a cuppa
  model = gensim.models.Word2Vec(corpus, size=100, min_count=5, workers=2, iter=50)
  model.save(fname)

words = "woman women man girl boy green blue".split()
for w1 in words:
  for w2 in words:
    print(w1, w2, model.similarity(w1, w2))

print(model.most_similar(positive=['woman', ''], topn=1))
print(model.similarity('woman', 'girl'))girl

在gensim模块中已经封装了13年提出的model--word2vec,所以我们直接开始建立模型

Python实现word2Vec model过程解析

这是建立模型的过程,最后会出现saving Word2vec的语句,代表已经成功建立了模型

Python实现word2Vec model过程解析

这是输入了 gorvement和news关键词后 所反馈的词语 --- administration, 他们之间的相关性是0.508

当我在输入 women 和 man ,他们显示的相关性的0.638 ,已经是非常高的一个数字。

值得一提的是,我用的语料库是直接从nltk里的brown语料库。其中大概包括了一些新闻之类的数据。

大家如果感兴趣的话,可以自己建立该模型,通过传入不同的语料库,来calc 一些term的 相关性噢

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Django Admin 实现外键过滤的方法
Sep 29 Python
Python探索之实现一个简单的HTTP服务器
Oct 28 Python
Python和Java进行DES加密和解密的实例
Jan 09 Python
Django开发中的日志输出的方法
Jul 02 Python
pygame游戏之旅 添加游戏界面按键图形
Nov 20 Python
python 常见字符串与函数的用法详解
Nov 23 Python
Python socket非阻塞模块应用示例
Sep 12 Python
Python 3.6 中使用pdfminer解析pdf文件的实现
Sep 25 Python
使用Python测试Ping主机IP和某端口是否开放的实例
Dec 17 Python
win10下python3.8的PIL库安装过程
Jun 08 Python
用pip给python安装matplotlib库的详细教程
Feb 24 Python
Python编程中内置的NotImplemented类型的用法
Mar 23 Python
Python爬虫爬取煎蛋网图片代码实例
Dec 16 #Python
python实现监控阿里云账户余额功能
Dec 16 #Python
Python实现密码薄文件读写操作
Dec 16 #Python
如何基于Python实现电子邮件的发送
Dec 16 #Python
Python如何基于selenium实现自动登录博客园
Dec 16 #Python
Python正则表达式急速入门(小结)
Dec 16 #Python
如何基于Python制作有道翻译小工具
Dec 16 #Python
You might like
PHP中is_dir()函数使用指南
2015/05/08 PHP
PHP的伪随机数与真随机数详解
2015/05/27 PHP
window.addeventjs事件驱动函数集合addEvent等
2008/02/19 Javascript
Extjs 几个方法的讨论
2010/01/28 Javascript
js 分页全选或反选标识实现代码
2011/08/09 Javascript
30个让人兴奋的视差滚动(Parallax Scrolling)效果网站
2012/03/04 Javascript
JavaScript中的面向对象介绍
2012/06/30 Javascript
JQuery+CSS提示框实现思路及代码(纯手工打造)
2013/05/07 Javascript
jquery获取被勾选的checked(选中)的那一行的3列和4列的值
2013/07/04 Javascript
JS对象与json字符串格式转换实例
2014/10/28 Javascript
jQuery时间轴插件使用详解
2015/07/16 Javascript
判断横屏竖屏(三种)
2017/02/13 Javascript
你应该知道的几类npm依赖包管理详解
2017/10/06 Javascript
Node.js使用cookie保持登录的方法
2018/05/11 Javascript
vue实现随机验证码功能的实例代码
2019/04/30 Javascript
JavaScript交换两个变量方法实例
2019/11/25 Javascript
Js数组扁平化实现方法代码总汇
2020/11/11 Javascript
举例详解Python中循环语句的嵌套使用
2015/05/14 Python
Python实现多并发访问网站功能示例
2017/06/19 Python
Django学习笔记之ORM基础教程
2018/03/27 Python
使用Anaconda3建立虚拟独立的python2.7环境方法
2018/06/11 Python
python 将字符串完成特定的向右移动方法
2019/06/11 Python
Django实现CAS+OAuth2的方法示例
2019/10/30 Python
python分布式计算dispy的使用详解
2019/12/22 Python
python利用tkinter实现图片格式转换的示例
2020/09/28 Python
东方红海科技面试题软件测试方面
2012/02/08 面试题
幼儿园毕业园长感言
2014/02/24 职场文书
小学生十佳少年事迹材料
2014/08/20 职场文书
中国在我心中演讲稿
2014/09/13 职场文书
大学生军训自我鉴定范文
2014/09/18 职场文书
党支部书记四风问题整改措施
2014/09/24 职场文书
自荐信格式范文
2015/03/04 职场文书
计划生育目标责任书
2015/05/09 职场文书
2016教师廉洁从教心得体会
2016/01/13 职场文书
慰问信(范文3篇)
2019/10/23 职场文书
Linux7.6二进制安装Mysql8.0.27详细操作步骤
2021/11/27 MySQL