python批量导入数据进Elasticsearch的实例


Posted in Python onMay 30, 2018

ES在之前的博客已有介绍,提供很多接口,本文介绍如何使用python批量导入。ES官网上有较多说明文档,仔细研究并结合搜索引擎应该不难使用。

先给代码

#coding=utf-8
from datetime import datetime
from elasticsearch import Elasticsearch
from elasticsearch import helpers
es = Elasticsearch()
actions = []
f=open('index.txt')
i=1
for line in f:
 line = line.strip().split(' ')
 action={
 "_index":"image",
 "_type":"imagetable",
 "_id":i,
 "_source":{
  u"图片名":line[0].decode('utf8'),
  u"来源":line[1].decode('utf8'),
  u"权威性":line[2].decode('utf8'),
  u"大小":line[3].decode('utf8'),
  u"质量":line[4].decode('utf8'),
  u"类别":line[5].decode('utf8'),
  u"型号":line[6].decode('utf8'),
  u"国别":line[7].decode('utf8'),
  u"采集人":line[8].decode('utf8'),
  u"所属部门":line[9].decode('utf8'),
  u"关键词":line[10].decode('utf8'),
  u"访问权限":line[11].decode('utf8') 
  }
 }
 i+=1
 actions.append(action)
 if(len(actions)==500):
 helpers.bulk(es, actions)
 del actions[0:len(actions)]
if (len(actions) > 0):
 helpers.bulk(es, actions)

每句话的含义还是很明显的,这里需要说几点,首先是index.txt是以utf8编码的,所以需要decode('utf8')转换成unicode对象,并且“图片名”前需要加u,否则ES会报错

导入的速度还是很快的,2000多条记录每秒。

以上这篇python批量导入数据进Elasticsearch的实例就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python多线程实例教程
Sep 06 Python
用Python实现斐波那契(Fibonacci)函数
Mar 25 Python
用python写个自动SSH登录远程服务器的小工具(实例)
Jun 17 Python
Python数据分析库pandas基本操作方法
Apr 08 Python
Pandas之drop_duplicates:去除重复项方法
Apr 18 Python
python ftp 按目录结构上传下载的实现代码
Sep 12 Python
对python的输出和输出格式详解
Dec 08 Python
Python数据报表之Excel操作模块用法分析
Mar 11 Python
python批量创建指定名称的文件夹
Mar 21 Python
python获取linux系统信息的三种方法
Oct 14 Python
基于python实现坦克大战游戏
Oct 27 Python
教你漂亮打印Pandas DataFrames和Series
May 29 Python
用python简单实现mysql数据同步到ElasticSearch的教程
May 30 #Python
django1.11.1 models 数据库同步方法
May 30 #Python
Python使用tkinter库实现文本显示用户输入功能示例
May 30 #Python
python自动化报告的输出用例详解
May 30 #Python
Django项目中model的数据处理以及页面交互方法
May 30 #Python
Python实现的生产者、消费者问题完整实例
May 30 #Python
Django 忘记管理员或忘记管理员密码 重设登录密码的方法
May 30 #Python
You might like
Apache+php+mysql在windows下的安装与配置图解(最新版)
2008/11/30 PHP
PHP 中文乱码解决办法总结分析
2009/07/30 PHP
Discuz 模板语句分析及知识技巧
2009/08/21 PHP
PHP 反向排序和随机排序代码
2010/06/30 PHP
探讨如何在PHP开启gzip页面压缩实例
2013/06/09 PHP
laravel框架中表单请求类型和CSRF防护实例分析
2019/11/23 PHP
用js实现上传图片前的预览(TX的面试题)
2007/08/14 Javascript
javascript options属性集合操作代码
2009/12/28 Javascript
jquery radio 操作代码
2011/03/16 Javascript
js中的replace方法使用介绍
2013/10/28 Javascript
基于jQuery实现的图片切换焦点图整理
2014/12/07 Javascript
jQuery+easyui中的combobox实现下拉框特效
2015/02/27 Javascript
javascript实现的网站访问量统计代码
2015/12/20 Javascript
jQuery.uploadify文件上传组件实例讲解
2016/09/23 Javascript
详解vue组件基础
2018/05/04 Javascript
微信小程序的部署方法步骤
2018/09/04 Javascript
JS 实现微信扫一扫功能
2018/09/14 Javascript
antd-mobile ListView长列表的数据更新遇到的坑
2020/04/08 Javascript
对python 操作solr索引数据的实例详解
2018/12/07 Python
python绘图模块之利用turtle画图
2021/02/12 Python
pandas map(),apply(),applymap()区别解析
2021/02/24 Python
一款基于css3麻将筛子3D翻转特效的实例教程
2014/12/31 HTML / CSS
html5将图片转换成base64的实例代码
2016/09/21 HTML / CSS
澳大利亚男士西服品牌:M.J.Bale
2018/02/06 全球购物
荷兰最大的儿童服装店:The Kids Republic
2019/04/13 全球购物
大学生活学习的自我评价
2013/12/03 职场文书
争论的故事教学反思
2014/02/06 职场文书
应届生求职信范文
2014/05/26 职场文书
优秀学生党员先进事迹材料
2014/05/29 职场文书
禁止酒驾标语
2014/06/25 职场文书
机电专业毕业生求职信
2014/07/01 职场文书
机械专业求职信范文
2014/07/15 职场文书
如何写股份合作协议书
2014/09/11 职场文书
党员批评与自我批评思想汇报
2014/10/08 职场文书
违纪检讨书
2015/01/27 职场文书
大学运动会加油稿
2015/07/22 职场文书