python snownlp情感分析简易demo(分享)


Posted in Python onJune 04, 2017

SnowNLP是国人开发的python类库,可以方便的处理中文文本内容,是受到了TextBlob的启发而写的,由于现在大部分的自然语言处理库基本都是针对英文的,于是写了一个方便处理中文的类库,并且和TextBlob不同的是,这里没有用NLTK,所有的算法都是自己实现的,并且自带了一些训练好的字典。注意本程序都是处理的unicode编码,所以使用时请自行decode成unicode。MIT许可下发行。

其 github 主页

我自己修改了上文链接中的python代码并加入些许注释,以方便你的理解:

from snownlp import SnowNLP
# SnowNLP库:
# words:分词
# tags:关键词
# sentiments:情感度
# pinyin:拼音
# keywords(limit):关键词
# summary:关键句子
# sentences:语序
# tf:tf值
# idf:idf值
s = SnowNLP(u'这个东西真心很赞')
# s.words     # [u'这个', u'东西', u'真心', u'很', u'赞']
print(s.words)
s.tags # [(u'这个', u'r'), (u'东西', u'n'), (u'真心', u'd')
# , (u'很', u'd'), (u'赞', u'Vg')]
print(s.sentiments)
# s.sentiments  # 0.9769663402895832 positive的概率
# s.pinyin    # [u'zhe', u'ge', u'dong', u'xi', # u'zhen', u'xin', u'hen',
# u'zan']4
s = SnowNLP(u'「繁?字」「繁?中文」的叫法在??骋嗪艹R?。')
# s.han      # u'「繁体字」「繁体中文」的叫法在台湾亦很常见。'
print(s.han)
from snownlp import SnowNLP
text = u'''
自然语言处理是计算机科学领域与人工智能领域中的一个重要方向。
它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。
自然语言处理是一门融语言学、计算机科学、数学于一体的科学。
因此,这一领域的研究将涉及自然语言,即人们日常使用的语言,
所以它与语言学的研究有着密切的联系,但又有重要的区别。
自然语言处理并不是一般地研究自然语言,
而在于研制能有效地实现自然语言通信的计算机系统,
特别是其中的软件系统。因而它是计算机科学的一部分。
'''
s = SnowNLP(text)
print(s.keywords(6)) # [u'语言', u'自然', u'计算机'] 不能用tags输出关键字.
s.summary(3) # [u'因而它是计算机科学的一部分', u'自然语言处理是一门融语言学、计算机科学、
# 数学于一体的科学', u'自然语言处理是计算机科学领域与人工智能领域中的一个重要方向']s.sentences
# print(s.sentences)
print(s.sentiments) # 1.0
s = SnowNLP([[u'这篇', u'文章'],
       [u'那篇', u'论文'],
       [u'这个']])
# print(s.tf)
# print(s.idf)
# print(s.sim([u'文章'])) # [0.3756070762985226, 0, 0]

在编译运行之前,先得安装snownlp包,后续还有pylab,pandas模块:
在VS Code终端(查看->集成终端)里面输入:
pip install snownlp

pip install pylab

pip install pandas

前提是你安装了pip,若是pip没有安装可以查看我之前的 文章

在VS Code中我们可以右键模块名查看定义,便能看到模块的实现了.不得不说VS Code很强大,希望微软能这么一直走下去,走向开源走向跨平台!!

然后我随便提取了《心灵捕手》豆瓣网评,放在了txt中:

其实大多数情况下,大陆的译名比港译要更有味道。

It is not ur fault!

我是在电视上偶尔才看到这个电影的,当时看的时候真的很感人。 为什么会有这么天才的人,却有着这样子曲折的人生。
是认为剧本很好却没有被完全拍出来:) 对演员的表演还是心存质疑一点点~ 呵呵

好评

前几日刚刚看过,一部触动心灵的电影,寻找真正的人生

这篇影评写的很棒,我的眼睛湿润了

很好的片子

最后就是处理的程序了:

from snownlp import SnowNLP
import pandas as pd
import pylab as pl
txt = open('F:/_analyse_Emotion.txt')
text = txt.readlines()
txt.close()
print('读入成功')
sentences = []
senti_score = []
for i in text:
  a1 = SnowNLP(i)
  a2 = a1.sentiments
  sentences.append(i) # 语序...
  senti_score.append(a2)
  print('doing')
table = pd.DataFrame(sentences, senti_score)
# table.to_excel('F:/_analyse_Emotion.xlsx', sheet_name='Sheet1')
# ts = pd.Series(sentences, senti_score)
# ts = ts.cumsum()
# print(table)
x = [1, 2, 3, 4, 5, 6, 7, 8]
pl.mpl.rcParams['font.sans-serif'] = ['SimHei']
pl.plot(x, senti_score)
pl.title(u'心 灵 捕 手 网 评')
pl.xlabel(u'评 论 用 户')
pl.ylabel(u'情 感 程 度')
pl.show()

最后的效果:

python snownlp情感分析简易demo(分享)

可能有些不准确,我也是随便提取的数据,不过snownlp还是号称情感分析准确很高的!

以上这篇python snownlp情感分析简易demo(分享)就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python3.0与2.X版本的区别实例分析
Aug 25 Python
Python文件和目录操作详解
Feb 08 Python
python通过colorama模块在控制台输出彩色文字的方法
Mar 19 Python
深入理解python多进程编程
Jun 12 Python
Pycharm之快速定位到某行快捷键的方法
Jan 20 Python
python如何实现代码检查
Jun 28 Python
Python获取时间戳代码实例
Sep 24 Python
Python使用pymysql模块操作mysql增删改查实例分析
Dec 19 Python
Python GUI编程学习笔记之tkinter界面布局显示详解
Mar 30 Python
详解python os.path.exists判断文件或文件夹是否存在
Nov 16 Python
使用Python+Appuim 清理微信的方法
Jan 26 Python
Python requests用法和django后台处理详解
Mar 19 Python
Python 调用Java实例详解
Jun 02 #Python
python使用两种发邮件的方式smtp和outlook示例
Jun 02 #Python
Python爬虫DNS解析缓存方法实例分析
Jun 02 #Python
Python编程实现二叉树及七种遍历方法详解
Jun 02 #Python
Python递归函数定义与用法示例
Jun 02 #Python
matplotlib绘制符合论文要求的图片实例(必看篇)
Jun 02 #Python
Python 爬虫图片简单实现
Jun 01 #Python
You might like
采用header定义为文件然后readfile下载(隐藏下载地址)
2014/01/31 PHP
php使用多个进程同时控制文件读写示例
2014/02/28 PHP
PHP简单实现HTTP和HTTPS跨域共享session解决办法
2015/05/27 PHP
php结合curl实现多线程抓取
2015/07/09 PHP
yii2局部关闭(开启)csrf的验证的实例代码
2017/07/10 PHP
基于JQuery的Select选择框的华丽变身
2011/08/23 Javascript
一个关于javascript匿名函数的问题分析
2012/03/30 Javascript
引用外部js乱码问题分析及解决方案
2013/04/12 Javascript
Node.js的Koa框架上手及MySQL操作指南
2016/06/13 Javascript
javascript汉字拼音互转的简单实例
2016/10/09 Javascript
Bootstrap CSS布局之表格
2016/12/17 Javascript
BootStrap Fileinput的使用教程
2016/12/30 Javascript
angular指令笔记ng-options的使用方法
2017/09/18 Javascript
微信小程序使用progress组件实现显示进度功能【附源码下载】
2017/12/12 Javascript
动态Axios的配置步骤详解
2018/01/12 Javascript
javascript高仿热血传奇游戏实现代码
2018/02/22 Javascript
vue.js 双层嵌套for遍历的方法详解, 类似php foreach()
2018/09/07 Javascript
浅谈React之状态(State)
2018/09/19 Javascript
微信小程序纯文本实现@功能
2020/04/08 Javascript
如何在JavaScript中等分数组的实现
2020/12/13 Javascript
Python实现把xml或xsl转换为html格式
2015/04/08 Python
python中input()与raw_input()的区别分析
2016/02/27 Python
Python随机生成数据后插入到PostgreSQL
2016/07/28 Python
python并发2之使用asyncio处理并发
2017/12/21 Python
详解Python异常处理中的Finally else的功能
2017/12/29 Python
python pandas写入excel文件的方法示例
2019/06/25 Python
Python中zip()函数的简单用法举例
2019/09/02 Python
Hunkemöller西班牙:欧洲最大的内衣连锁店
2018/08/15 全球购物
给排水专业应届生求职信
2013/10/12 职场文书
餐饮业会计岗位职责
2013/12/19 职场文书
班组长工作职责
2013/12/25 职场文书
教师绩效考核方案
2014/01/21 职场文书
文明家庭先进事迹材料
2014/05/14 职场文书
小学校本培训方案
2014/06/06 职场文书
学雷锋日活动总结
2015/02/06 职场文书
GoFrame gredis缓存DoVar Conn连接对象 自动序列化GoFrame gredisDo/DoVar方法Conn连接对象自动序列化/反序列化总结
2022/06/14 Golang