对python借助百度云API对评论进行观点抽取的方法详解


Posted in Python onFebruary 21, 2019

通过百度云API接口抽取得到产品评论的观点,也掠去了很多评论中无用的内容以及符号,为后续进行文本主题挖掘或者规则的提取提供基础。

工具

1、百度云账号,申请应用接口(自然语言处理)

2、python3.5

以下是百度接口提供的说明:

对python借助百度云API对评论进行观点抽取的方法详解

对python借助百度云API对评论进行观点抽取的方法详解

我们使用到的可选值是13,kindle属于3C产品。

对python借助百度云API对评论进行观点抽取的方法详解

下面是代码示例:

from aip import AipNlp
import csv
import pandas as pd
from pandas.core.frame import DataFrame

""" 你的 APPID AK SK """
APP_ID = '********'
API_KEY = '********'
SECRET_KEY = '********'
client = AipNlp(APP_ID, API_KEY, SECRET_KEY)

# 导入评论数据文件,并找到第13列(12行)的评论内容提取出来
def output():
 urls = []
 with open('E:\\tb_iphone8.csv', "r") as f:
  reader = csv.reader(f)
  for row in reader:
   urls.append(row[12])
 return urls

# 通过百度云提供的API对评论观点进行提取
def commentTag():
 x = output()
 all={}
 abst=''
 for i in range(10560):
  text=x[i]
  """ 调用评论观点抽取 """
  """ 如果有可选参数 """
  # 可选参数为13表示利用了3C产品的语料库
  options = {}
  options["type"] = 13
  """ 带参数调用评论观点抽取 """
  result=client.commentTag(text, options)
  print(result)
  if "error_code" in result.keys():
   abst+=''
   all['abstract'] = abst
  else:
   data = result['items']
   items = data[0]
   abst += items['abstract']
   all['abstract'] = abst
 return abst

if __name__ == '__main__':
 ALL=commentTag()
 print(ALL)

得到的结果如下:

对python借助百度云API对评论进行观点抽取的方法详解

可以看到,现在抽取出来的评论部分内容都是具有一定观点倾向的,大部分没有什么含义的评论内容已经被除去,这对后面的分析有一定的帮助。

以上这篇对python借助百度云API对评论进行观点抽取的方法详解就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
用十张图详解TensorFlow数据读取机制(附代码)
Feb 06 Python
基于anaconda下强大的conda命令介绍
Jun 11 Python
对Xpath 获取子标签下所有文本的方法详解
Jan 02 Python
Python英文文本分词(无空格)模块wordninja的使用实例
Feb 20 Python
浅谈Django中view对数据库的调用方法
Jul 18 Python
PyQt5多线程刷新界面防假死示例
Dec 13 Python
Python concurrent.futures模块使用实例
Dec 24 Python
Python常用库Numpy进行矩阵运算详解
Jul 21 Python
在 Python 中使用 MQTT的方法
Aug 18 Python
互斥锁解决 Python 中多线程共享全局变量的问题(推荐)
Sep 28 Python
详解修改Anaconda中的Jupyter Notebook默认工作路径的三种方式
Jan 24 Python
python 模块重载的五种方法
Apr 24 Python
用python实现刷点击率的示例代码
Feb 21 #Python
Python快速转换numpy数组中Nan和Inf的方法实例说明
Feb 21 #Python
python根据文章标题内容自动生成摘要的实例
Feb 21 #Python
python3.6实现学生信息管理系统
Feb 21 #Python
Python基于滑动平均思想实现缺失数据填充的方法
Feb 21 #Python
python-itchat 统计微信群、好友数量,及原始消息数据的实例
Feb 21 #Python
python+mysql实现学生信息查询系统
Feb 21 #Python
You might like
通过table标签,PHP输出EXCEL的实现方法
2013/07/24 PHP
浅析Mysql 数据回滚错误的解决方法
2013/08/05 PHP
javascript编程起步(第一课)
2007/01/10 Javascript
jquery下实现overlay遮罩层代码
2010/08/25 Javascript
有关DOM元素与事件的3个谜题
2010/11/11 Javascript
jquery 文本上下无缝滚动,鼠标放上去就停止 小例子
2013/06/05 Javascript
js导出table到excel同时兼容FF和IE示例
2013/09/03 Javascript
仿百度的关键词匹配搜索示例
2013/09/25 Javascript
JS基于面向对象实现的拖拽库实例
2015/09/24 Javascript
javascript实现抽奖程序的简单实例
2016/06/07 Javascript
BootStrap 表单控件之单选按钮水平排列
2017/05/23 Javascript
详解node+express+ejs+bootstrap构建项目
2017/09/27 Javascript
Vue 中文本内容超出规定行数后展开收起的处理的实现方法
2019/04/28 Javascript
实现elementUI表单的全局验证的方法步骤
2019/04/29 Javascript
node.js使用fs读取文件出错的解决方案
2019/10/23 Javascript
基于Vue的侧边目录组件的实现
2020/02/05 Javascript
js实现简单的点名器随机色实例代码
2020/09/20 Javascript
vue使用canvas实现移动端手写签名
2020/09/22 Javascript
在react项目中使用antd的form组件,动态设置input框的值
2020/10/24 Javascript
[13:56]DAC2018 4.5SOLO赛决赛 MidOne vs Paparazi第一场
2018/04/06 DOTA
Python每天必学之bytes字节
2016/01/28 Python
使用python批量读取word文档并整理关键信息到excel表格的实例
2018/11/07 Python
python 判断三个数字中的最大值实例代码
2019/07/24 Python
python检测服务器端口代码实例
2019/08/31 Python
Django操作session 的方法
2020/03/09 Python
python数据库操作mysql:pymysql、sqlalchemy常见用法详解
2020/03/30 Python
python中sympy库求常微分方程的用法
2020/04/28 Python
Anaconda+spyder+pycharm的pytorch配置详解(GPU)
2020/10/18 Python
教师政风行风自查自纠报告
2014/10/21 职场文书
1000字打架检讨书
2014/11/03 职场文书
导游欢送词
2015/01/31 职场文书
酒店工程部主管岗位职责
2015/04/16 职场文书
党员“一帮一”活动总结
2015/05/07 职场文书
Mysql效率优化定位较低sql的两种方式
2021/05/26 MySQL
mongodb的安装和开机自启动详细讲解
2021/08/02 MongoDB
SQL基础查询和LINQ集成化查询
2022/01/18 MySQL