剖析后OpLog订阅MongoDB的数据变更就没那么难了


Posted in MongoDB onFebruary 24, 2022

前言

我们开源了一个订阅分发mysql的binlog的项目,一直用的非常好,忽然有天开发说能不能支持MongoDB的数据订阅呢,MongoDB的使用度也挺广泛的。安排。经过简单的了解后发现MongoDB也有类似binlog的机制,最终花了两天时间把功能完成,并统一抽象集成到binlog开源项目中,使用和binlog同一套订阅分发模型管理MongoDB数据源。整个过程非常顺利,比整mysql的binlog要简单的多了。

oplog简介

先来聊聊MongoDB的主备机制,和mysql的binlog类似,在MongoDB中,有一个系统库“”Local”,库里有一个集合“oplog.rs”,这个集合类似于binlog文件,里面记录了MongoDB的所有操作。从节点通过读取oplog.rs里的数据做到数据同步。

解析oplog

和订阅mysql的binlog一样(模拟一个从节点mysql)。我们的订阅服务要像从节点那样读取解析oplog.rs里的数据。解析前先看下oplog.rs的Document的数据结构

剖析后OpLog订阅MongoDB的数据变更就没那么难了

上图是一个插入的数据的日志,可见oplog的doc中共有如下字段,含义分别如下:

ts:操作的时间戳(非常重要)

t:term最初在主数据库上生成操作的。(含义不明)

h:本次操作的唯一hashID

v: 版本号

op:操作类型,有六种类型,我们只需要关注其中的i(插入)、u(更新)、d(删除)即可

ns:库名和集合名称,中间使用“.”连接

o:本次操作的document内容

o2:只有op操作类型时u更新时,才会有这个字段,代表更新的条件语句

$set:o2获取后的文档里的属性,代表更新的字段

如上字段,完成一次oplog的解析,只需要ts、op、ns、o、o2、$set即可,其中ts非常重要,可以类比为binlog中的Position。同步mysql的数据时,通过记录消费binlog的位置,也就是Position,可以有效避免订阅服务停机后,消费记录丢失的问题。同步MongoDB时,通过记录ts的值,来记录消费的位置,可以到达和订阅binlog一样的效果。和mysql订阅不同的是,MongoDB的同步需要同步服务自己查询,而且oplog在MongoDB4.0之前的版本有大小限制,超过设置的容量后,老的数据就会被丢失,在4.0之后的版本已经解除了这个限制。

代码

上面已经分析了oplog的结构以及订阅步骤,下面我们直接构建查询即可,需要注意,每次获取到的ts值,需要存储记录下来,已便重新订阅时,从上次断开的记录重新开始。下面直接看代码,重点逻辑都以注释详尽

private BsonTimestamp queryTs;
    @Test
    public void OpLogTest() {
        MongoClient mongoClient = new MongoClient(new MongoClientURI("mongodb://admin:admin@127.0.0.1:3717"));
        MongoCollectioncollection = mongoClient.getDatabase("local")
                .getCollection("oplog.rs");

        //如果是首次订阅,需要使用自然排序查询,获取第最后一次操作的操作时间戳。如果是续订阅直接读取记录的值赋值给queryTs即可
        FindIterabletsCursor = collection.find().sort(new BasicDBObject("$natural", -1))
                .limit(1);
        Document tsDoc = tsCursor.first();
        queryTs = (BsonTimestamp) tsDoc.get("ts");
        while (true) try {
            //构建查询语句,查询大于当前查询时间戳queryTs的记录
            BasicDBObject query = new BasicDBObject("ts", new BasicDBObject("$gt", queryTs));
            MongoCursordocCursor = collection.find(query)
                    .cursorType(CursorType.TailableAwait) //没有数据时阻塞休眠
                    .noCursorTimeout(true) //防止服务器在不活动时间(10分钟)后使空闲的游标超时。
                    .oplogReplay(true) //结合query条件,获取增量数据,这个参数比较难懂,见:https://docs.mongodb.com/manual/reference/command/find/index.html
                    .maxAwaitTime(1, TimeUnit.SECONDS) //设置此操作在服务器上的最大等待执行时间
                    .iterator();
            while (docCursor.hasNext()) {
                Document document = docCursor.next();
                //更新查询时间戳
                queryTs = (BsonTimestamp) document.get("ts");
                //TODO 在这里接收到数据后通过订阅数据路由分发

                String op = document.getString("op");
                String database = document.getString("ns");
                Document context = (Document) document.get("o");
                Document where = null;
                if (op.equals("u")) {
                    where = (Document) document.get("o2");
                    if (context != null) {
                        context = (Document) context.get("$set");
                    }
                }
                System.err.println("操作时间戳:" + queryTs.getTime());
                System.err.println("操作类  型:" + op);
                System.err.println("数据库.集合:" + database);
                System.err.println("更新条件:" + JSON.toJSONString(where));
                System.err.println("文档内容:" + JSON.toJSONString(context));
            }
        } catch (Exception e) { e.printStackTrace(); }
    }

结语

上面代码只是一个简单的测试用例,完整的应用还需要考虑ts的记录更新,事件的抽象,数据的分发等。我们已经开源的binlog订阅分发项目目前支持数据源在线管理,订阅数据(库、表)在线管理,如果能够使用同一套管理后台管理binlog和oplog的订阅在好不过。要实现和binlog统一管理模型,配置和分发方面基本不需要改动,然后从顶层数据源方面做区分实现即可。

目前我们整合管理的功能都已经开发好了,关于oplog部分的代码还没提交到github上,后面会和大家相见。

以上就是剖析后OpLog订阅MongoDB的数据变更就没那么难了的详细内容,更多关于OpLog订阅MongoDB的数据变更的资料请关注三水点靠木其它相关文章!

MongoDB 相关文章推荐
MongoDB数据库常用的10条操作命令
Jun 18 MongoDB
mongodb的安装和开机自启动详细讲解
Aug 02 MongoDB
关于CentOS 8 搭建MongoDB4.4分片集群的问题
Oct 24 MongoDB
剖析后OpLog订阅MongoDB的数据变更就没那么难了
Feb 24 MongoDB
MongoDB数据库部署环境准备及使用介绍
Mar 21 MongoDB
MongoDB误操作后使用oplog恢复数据
Apr 11 MongoDB
MongoDB修改oplog大小的四种方法
Apr 11 MongoDB
Centos系统通过Docker安装并搭建MongoDB数据库
Apr 12 MongoDB
MongoDB数据库之添删改查
Apr 26 MongoDB
NoSQL优缺点与MongoDB数据库简介
Jun 05 MongoDB
MongoDB使用场景总结
SpringBoot系列之MongoDB Aggregations用法详解
MongoDB连接数据库并创建数据等使用方法
springboot + mongodb 通过经纬度坐标匹配平面区域的方法
Nov 01 #MongoDB
centos8安装MongoDB的详细过程
关于CentOS 8 搭建MongoDB4.4分片集群的问题
MongoDB日志切割的三种方式总结
Sep 15 #MongoDB
You might like
ThinkPHP3.0略缩图不能保存到子目录的解决方法
2012/09/30 PHP
php用户注册页面利用js进行表单验证具体实例
2013/10/17 PHP
php 把数字转换成汉字的代码
2015/07/21 PHP
鼠标滚轮控制网页横向移动实现思路
2013/03/22 Javascript
Jquery实现列表(隔行换色,全选,鼠标滑过当前行)效果实例
2013/06/09 Javascript
jQuery表单获取和失去焦点输入框提示效果的实例代码
2013/08/01 Javascript
jquery插件格式实例分析
2016/06/16 Javascript
重新理解JavaScript的六种继承方式
2017/03/24 Javascript
利用JavaScript实现栈的数据结构示例代码
2017/08/02 Javascript
通过实例学习React中事件节流防抖
2019/06/17 Javascript
VUE前后端学习tab写法实例
2019/08/06 Javascript
JS获取当前时间的年月日时分秒及时间的格式化的方法
2019/12/18 Javascript
Vue中避免滥用this去读取data中数据
2021/03/02 Vue.js
[05:13]TI4 中国战队 机场出征!!
2014/07/07 DOTA
2款Python内存检测工具介绍和使用方法
2014/06/01 Python
用Python实现QQ游戏大家来找茬辅助工具
2014/09/14 Python
关于numpy中np.nonzero()函数用法的详解
2017/02/07 Python
python的变量与赋值详细分析
2017/11/08 Python
同时安装Python2 & Python3 cmd下版本自由选择的方法
2017/12/09 Python
用python实现对比两张图片的不同
2018/02/05 Python
django有外键关系的两张表如何相互查找
2020/02/10 Python
解决Pycharm 导入其他文件夹源码的2种方法
2020/02/12 Python
python基本算法之实现归并排序(Merge sort)
2020/09/01 Python
Python 必须了解的5种高级特征
2020/09/10 Python
Python之字典对象的几种创建方法
2020/09/30 Python
只要五步 就可以用HTML5/CSS3快速制作便签贴特效(图)
2012/06/04 HTML / CSS
HTML5实现预览本地图片
2016/02/17 HTML / CSS
HTML5拖拽文件上传的示例代码
2021/03/04 HTML / CSS
澳大利亚在线购买葡萄酒:The Wine Collective
2020/02/20 全球购物
珍惜资源的建议书
2014/08/26 职场文书
党员教师群众路线思想汇报范文
2014/10/28 职场文书
客房服务员岗位职责
2015/02/09 职场文书
幼儿园见习总结
2015/06/23 职场文书
nginx网站服务如何配置防盗链(推荐)
2021/03/31 Servers
Java方法重载和方法重写的区别到底在哪?
2021/06/11 Java/Android
一次线上mongo慢查询问题排查处理记录
2022/03/18 MongoDB