python用户评论标签匹配的解决方法


Posted in Python onMay 31, 2018

我们观察用户评论发现:属性词往往和情感词伴随出现,原因是用户通常会在描述属性时表达情感,属性是情感表达的对象。还发现:属性词和专用情感词基本都是名词或形容词(形谓词)。

算法流程图如下:

python用户评论标签匹配的解决方法

评论数据如下:

python用户评论标签匹配的解决方法

代码如下:

#encoding=utf-8 
 
############################# 
# 
# 功能:给定一些中文的产品评论,希望从中找到评价对象及评价词。 
# 
# @author:licl 
# 
############################## 
 
fdata = open('JD_DFB_comments_out.txt','r') 
Output = open('Pattern_Result.txt','a') 
 
try: 
 data = fdata.readlines() 
  
 listline = [] 
  
  
 for line in data: 
   
  listline = line.replace(" ","/") 
  listline = listline.split("/") 
   
  i = 1 
   
  while i < len(listline): 
    
   if listline[i] != "名词": 
     
    i = i+2 
     
   else: 
     
    new_list = ["","",""] 
    new_list[0] = listline[i-1] 
     
    a = i-1 
    i = i+2 
     
    while i < len(listline):     
      
     if listline[i] == "标点": 
       
      i = i+2 
      break 
      
     else: 
       
      if listline[i-1]=='不' or listline[i-1]=='不怎么样' or listline[i-1]=='不怎么' or listline[i-1]=='不太':  
       new_list[1] = listline[i-1] 
      if listline[i] == "形容词" or listline[i] == "形谓词": 
       new_list[1] += listline[i-1] 
        
       b = i-1     
       t = (b-a)/2   
       new_list[2] = str(t) 
       for line in new_list: 
         
        Output.write(line + " ") 
         
       Output.write("\n")  
       break 
       
      else: 
      
       i = i+2  
except: 
 print "‘文件不存在'或者‘文件无法打开'" 
   
finally: 
  
 fdata.close() 
 Output.close()

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python检测是文件还是目录的方法
Jul 03 Python
python入门教程之识别验证码
Mar 04 Python
python 统计代码行数简单实例
May 04 Python
Queue 实现生产者消费者模型(实例讲解)
Nov 13 Python
人工智能最火编程语言 Python大战Java!
Nov 13 Python
numpy使用fromstring创建矩阵的实例
Jun 15 Python
关于django 1.10 CSRF验证失败的解决方法
Aug 31 Python
python将print输出的信息保留到日志文件中
Sep 27 Python
感知器基础原理及python实现过程详解
Sep 30 Python
Pyinstaller加密打包应用的示例代码
Jun 11 Python
Python通过format函数格式化显示值
Oct 17 Python
SpringBoot首页设置解析(推荐)
Feb 11 Python
python批量查询、汉字去重处理CSV文件
May 31 #Python
python破解zip加密文件的方法
May 31 #Python
python删除本地夹里重复文件的方法
Nov 19 #Python
Python处理命令行参数模块optpars用法实例分析
May 31 #Python
python筛选出两个文件中重复行的方法
May 31 #Python
python删除文本中行数标签的方法
May 31 #Python
Python使用wget实现下载网络文件功能示例
May 31 #Python
You might like
url decode problem 解决方法
2011/12/26 PHP
PHP中Header使用的HTTP协议及常用方法小结
2014/11/04 PHP
php实现图片上传、剪切功能
2016/05/07 PHP
Yii框架通过请求组件处理get,post请求的方法分析
2019/09/03 PHP
基于jquery的一个拖拽到指定区域内的效果
2011/09/21 Javascript
使用JavaScript动态设置样式实现代码及演示动画
2013/01/25 Javascript
JS将滑动门改为选项卡(需鼠标点击)的实现方法
2015/09/27 Javascript
JS基于Mootools实现的个性菜单效果代码
2015/10/21 Javascript
Bootstrap进度条组件知识详解
2016/05/01 Javascript
jQuery配合coin-slider插件制作幻灯片效果的流程解析
2016/05/13 Javascript
sencha ext js 6 快速入门(必看)
2016/06/01 Javascript
如何用JS判断两个数字的大小
2016/07/21 Javascript
如何将 jQuery 从你的 Bootstrap 项目中移除(取而代之使用Vue.js)
2017/07/17 jQuery
nodejs密码加密中生成随机数的实例代码
2017/07/17 NodeJs
vue.js系列中的vue-fontawesome使用
2018/02/10 Javascript
学习Vue组件实例
2018/04/28 Javascript
Vue中$refs的用法详解
2018/06/24 Javascript
[02:42]2014DOTA2国际邀请赛 三冰专访:我会打到Ti20
2014/07/13 DOTA
介绍Python中的文档测试模块
2015/04/28 Python
使用Python生成随机密码的示例分享
2016/02/18 Python
python中is与双等于号“==”的区别示例详解
2017/11/21 Python
python在非root权限下的安装方法
2018/01/23 Python
人生苦短我用python python如何快速入门?
2018/03/12 Python
完美解决python3.7 pip升级 拒绝访问问题
2019/07/12 Python
python实现12306登录并保存cookie的方法示例
2019/12/17 Python
pandas实现DataFrame显示最大行列,不省略显示实例
2019/12/26 Python
浅谈python之自动化运维(Paramiko)
2020/01/31 Python
Python实现aes加密解密多种方法解析
2020/05/15 Python
澳大利亚第一的设计师礼服租赁网站:GlamCorner
2017/08/13 全球购物
预订奥兰多和佛罗里达州公园门票:FloridaTix
2018/01/03 全球购物
Skyscanner澳大利亚:全球领先的旅游搜索网站
2018/03/24 全球购物
线程的基本概念、线程的基本状态以及状态之间的关系
2012/10/26 面试题
高三自我鉴定
2013/10/23 职场文书
员工家属慰问信
2015/03/24 职场文书
借条如何写
2015/05/26 职场文书
世界十大评分最高的动漫,CLANNAD上榜,第八赚足人们眼泪
2022/03/18 日漫