python用户评论标签匹配的解决方法


Posted in Python onMay 31, 2018

我们观察用户评论发现:属性词往往和情感词伴随出现,原因是用户通常会在描述属性时表达情感,属性是情感表达的对象。还发现:属性词和专用情感词基本都是名词或形容词(形谓词)。

算法流程图如下:

python用户评论标签匹配的解决方法

评论数据如下:

python用户评论标签匹配的解决方法

代码如下:

#encoding=utf-8 
 
############################# 
# 
# 功能:给定一些中文的产品评论,希望从中找到评价对象及评价词。 
# 
# @author:licl 
# 
############################## 
 
fdata = open('JD_DFB_comments_out.txt','r') 
Output = open('Pattern_Result.txt','a') 
 
try: 
 data = fdata.readlines() 
  
 listline = [] 
  
  
 for line in data: 
   
  listline = line.replace(" ","/") 
  listline = listline.split("/") 
   
  i = 1 
   
  while i < len(listline): 
    
   if listline[i] != "名词": 
     
    i = i+2 
     
   else: 
     
    new_list = ["","",""] 
    new_list[0] = listline[i-1] 
     
    a = i-1 
    i = i+2 
     
    while i < len(listline):     
      
     if listline[i] == "标点": 
       
      i = i+2 
      break 
      
     else: 
       
      if listline[i-1]=='不' or listline[i-1]=='不怎么样' or listline[i-1]=='不怎么' or listline[i-1]=='不太':  
       new_list[1] = listline[i-1] 
      if listline[i] == "形容词" or listline[i] == "形谓词": 
       new_list[1] += listline[i-1] 
        
       b = i-1     
       t = (b-a)/2   
       new_list[2] = str(t) 
       for line in new_list: 
         
        Output.write(line + " ") 
         
       Output.write("\n")  
       break 
       
      else: 
      
       i = i+2  
except: 
 print "‘文件不存在'或者‘文件无法打开'" 
   
finally: 
  
 fdata.close() 
 Output.close()

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python插入数据到列表的方法
Apr 30 Python
构建Python包的五个简单准则简介
Jun 15 Python
python实现自动重启本程序的方法
Jul 09 Python
python中input()与raw_input()的区别分析
Feb 27 Python
Python中使用platform模块获取系统信息的用法教程
Jul 08 Python
Python优先队列实现方法示例
Sep 21 Python
numpy ndarray 取出满足特定条件的某些行实例
Dec 05 Python
Pytorch 中retain_graph的用法详解
Jan 07 Python
Python unittest discover批量执行代码实例
Sep 08 Python
python3爬虫中多线程的优势总结
Nov 24 Python
Python中正则表达式对单个字符,多个字符和匹配边界等使用
Jan 27 Python
python使用numpy中的size()函数实例用法详解
Jan 29 Python
python批量查询、汉字去重处理CSV文件
May 31 #Python
python破解zip加密文件的方法
May 31 #Python
python删除本地夹里重复文件的方法
Nov 19 #Python
Python处理命令行参数模块optpars用法实例分析
May 31 #Python
python筛选出两个文件中重复行的方法
May 31 #Python
python删除文本中行数标签的方法
May 31 #Python
Python使用wget实现下载网络文件功能示例
May 31 #Python
You might like
字符串长度函数strlen和mb_strlen的区别示例介绍
2014/09/09 PHP
php使用Jpgraph绘制饼状图的方法
2015/06/10 PHP
PHP微信支付开发实例
2016/06/22 PHP
Redis在Laravel项目中的应用实例详解
2017/08/11 PHP
PHP实现微信小程序用户授权的工具类示例
2019/03/05 PHP
关于laravel后台模板laravel-admin select框的使用详解
2019/10/03 PHP
解决windows上php xdebug 无法调试的问题
2020/02/19 PHP
学习JS面向对象成果 借国庆发布个最新作品与大家交流
2009/10/03 Javascript
jquery js 重置表单 reset()具体实现代码
2013/08/05 Javascript
Javascript表格翻页效果实现思路及代码
2013/08/23 Javascript
JS从数组中随机取出几个数组元素的方法
2016/08/02 Javascript
用jQuery的AJax实现异步访问、异步加载
2016/11/02 Javascript
深入理解javascript的getTime()方法
2017/02/16 Javascript
js a标签点击事件
2017/03/30 Javascript
vue 数据遍历筛选 过滤 排序的应用操作
2020/11/17 Javascript
从零学python系列之从文件读取和保存数据
2014/05/23 Python
Python中的匿名函数使用简介
2015/04/27 Python
快速查询Python文档方法分享
2017/12/27 Python
pyqt5的QComboBox 使用模板的具体方法
2018/09/06 Python
python求质数的3种方法
2018/09/28 Python
在Python中输入一个以空格为间隔的数组方法
2018/11/13 Python
Python 使用Numpy对矩阵进行转置的方法
2019/01/28 Python
pytorch 利用lstm做mnist手写数字识别分类的实例
2020/01/10 Python
如何写python的配置文件
2020/06/07 Python
keras 多任务多loss实例
2020/06/22 Python
css3实现元素环绕中心点布局的方法示例
2019/01/15 HTML / CSS
4s店总经理岗位职责
2013/12/31 职场文书
土木工程专业推荐信
2014/02/19 职场文书
《邮票齿孔的故事》教学反思
2014/02/22 职场文书
2014年大学生四年规划书范文
2014/04/03 职场文书
竞选班干部演讲稿300字
2014/08/20 职场文书
辞职离别感言
2015/08/04 职场文书
社会实践心得体会范文
2016/01/14 职场文书
Nginx反向代理及负载均衡如何实现(基于linux)
2021/03/31 Servers
详解MySQL的Seconds_Behind_Master
2021/05/18 MySQL
实战 快速定位MySQL的慢SQL
2022/03/22 MySQL