python用户评论标签匹配的解决方法


Posted in Python onMay 31, 2018

我们观察用户评论发现:属性词往往和情感词伴随出现,原因是用户通常会在描述属性时表达情感,属性是情感表达的对象。还发现:属性词和专用情感词基本都是名词或形容词(形谓词)。

算法流程图如下:

python用户评论标签匹配的解决方法

评论数据如下:

python用户评论标签匹配的解决方法

代码如下:

#encoding=utf-8 
 
############################# 
# 
# 功能:给定一些中文的产品评论,希望从中找到评价对象及评价词。 
# 
# @author:licl 
# 
############################## 
 
fdata = open('JD_DFB_comments_out.txt','r') 
Output = open('Pattern_Result.txt','a') 
 
try: 
 data = fdata.readlines() 
  
 listline = [] 
  
  
 for line in data: 
   
  listline = line.replace(" ","/") 
  listline = listline.split("/") 
   
  i = 1 
   
  while i < len(listline): 
    
   if listline[i] != "名词": 
     
    i = i+2 
     
   else: 
     
    new_list = ["","",""] 
    new_list[0] = listline[i-1] 
     
    a = i-1 
    i = i+2 
     
    while i < len(listline):     
      
     if listline[i] == "标点": 
       
      i = i+2 
      break 
      
     else: 
       
      if listline[i-1]=='不' or listline[i-1]=='不怎么样' or listline[i-1]=='不怎么' or listline[i-1]=='不太':  
       new_list[1] = listline[i-1] 
      if listline[i] == "形容词" or listline[i] == "形谓词": 
       new_list[1] += listline[i-1] 
        
       b = i-1     
       t = (b-a)/2   
       new_list[2] = str(t) 
       for line in new_list: 
         
        Output.write(line + " ") 
         
       Output.write("\n")  
       break 
       
      else: 
      
       i = i+2  
except: 
 print "‘文件不存在'或者‘文件无法打开'" 
   
finally: 
  
 fdata.close() 
 Output.close()

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
在Python中实现贪婪排名算法的教程
Apr 17 Python
完美解决Python2操作中文名文件乱码的问题
Jan 04 Python
python3 遍历删除特定后缀名文件的方法
Apr 23 Python
对Python中gensim库word2vec的使用详解
May 08 Python
python Pandas库基础分析之时间序列的处理详解
Jul 13 Python
Django组件content-type使用方法详解
Jul 19 Python
Python  Django 母版和继承解析
Aug 09 Python
Python基本语法之运算符功能与用法详解
Oct 22 Python
python--shutil移动文件到另一个路径的操作
Jul 13 Python
在Python中字典按值排序的实现方法
Nov 12 Python
Python中pass的作用与使用教程
Nov 13 Python
Python中的turtle画箭头,矩形,五角星
Mar 16 Python
python批量查询、汉字去重处理CSV文件
May 31 #Python
python破解zip加密文件的方法
May 31 #Python
python删除本地夹里重复文件的方法
Nov 19 #Python
Python处理命令行参数模块optpars用法实例分析
May 31 #Python
python筛选出两个文件中重复行的方法
May 31 #Python
python删除文本中行数标签的方法
May 31 #Python
Python使用wget实现下载网络文件功能示例
May 31 #Python
You might like
PHP写MySQL数据 实现代码
2009/06/15 PHP
php实现图形显示Ip地址的代码及注释
2014/01/20 PHP
php实现的mongodb操作类实例
2015/04/03 PHP
PHP表单提交后引号前自动加反斜杠的原因及三种办法关闭php魔术引号
2015/09/30 PHP
php外部执行命令函数用法小结
2016/10/11 PHP
PHP微信公众号开发之微信红包实现方法分析
2017/07/14 PHP
laravel 获取当前url的别名方法
2019/10/11 PHP
如何让您的中波更粗更长 - 中波框形天线制作
2021/03/10 无线电
再说AutoComplete自动补全之实现原理
2011/11/05 Javascript
JS格式化数字保留两位小数点示例代码
2013/10/15 Javascript
简单实用的反馈表单无刷新提交带验证
2013/11/15 Javascript
点击button获取text内容并改变样式的js实现
2014/09/09 Javascript
老生常谈onBlur事件与onfocus事件(js)
2016/07/09 Javascript
jQuery实现页面下拉100像素出现悬浮窗口的方法
2016/09/05 Javascript
详解jQuery简单的表单应用
2016/12/16 Javascript
jQuery Easyui datagrid editor为combobox时指定数据源实例
2016/12/19 Javascript
javascript 正则表达式分组、断言详解
2017/04/20 Javascript
解决vue同一slot在组件中渲染多次的问题
2018/09/06 Javascript
js中this的指向问题归纳总结
2018/11/28 Javascript
Vee-validate 父组件获取子组件表单校验结果的实例代码
2019/05/20 Javascript
JavaScript前端页面搜索功能案例【基于jQuery】
2019/07/10 jQuery
python访问系统环境变量的方法
2015/04/29 Python
遗传算法python版
2018/03/19 Python
使用python批量修改XML文件中图像的depth值
2020/07/22 Python
html5配合css3实现带提示文字的输入框(摆脱js)
2013/03/08 HTML / CSS
美国知名日用品连锁超市:Dollar General(多来店)
2017/01/14 全球购物
美国在线珠宝商店:SZUL
2017/02/11 全球购物
西部世纪.net笔试题面试题
2014/04/03 面试题
写自荐信的七个技巧
2013/10/15 职场文书
2013年学期结束动员演讲稿
2014/01/07 职场文书
大学生职业生涯规划书前言
2014/01/09 职场文书
文明家庭先进事迹材
2014/01/27 职场文书
2015年暑期社会实践方案
2015/07/14 职场文书
python如何进行基准测试
2021/04/26 Python
python基于tkinter实现gif录屏功能
2021/05/19 Python
《杜鹃的婚约》OP主题曲「凸凹」无字幕影像公开
2022/04/08 日漫