1. 本际云推荐 - 专业推荐VPS、服务器,IDC点评首页
  2. 云主机运维
  3. VPS运维

ogg同步数据到kafka案例简介

ogg同步数据到kafka案例简介

作为一个oggers,我们经常需要进行数据的同步,而大部分情况下是RDBMS之间的同步,例如oracle到oracle,oracle到mysql,sqlserver到oracle等等场景。但是我们也可以将数据同步到BigData平台及Kafka等消息中间件进行同步。

ogg同步数据到kafka案例简介

背景

在本案例中,我们需要将一个系统的实时数据采集到大数据平台。根据统一的实现方案,Kafka规划原则:省分topic隔离;不同省分按实例划分对接topic;每张表对应topic的一个partition。针对本次环境源端是oracle12c数据库,目标端是Kafka2.11-1.0.2集群,因此我们需要使用 ogg12cfororacle 源端软件包以及 OGG_BigData 的软件包来实现数据同步。

实施

我们需要对源端数据库和目标端Kafka集群进行部署,使用ogg12c12.3的集成模式,按常规配置 ex_kaf、dp_kaf 的进程即可。对于目标端Kafka集群来说,ogg的目标端程序实际上是作为生产者客户端,将解析 trail 文件得到的数据推送到 Kafka 中。此外,在Kafka属性参数文件中,我们可以指定自定义生产者方法,继承 ogg 自带的生产者父类,编写自己的生产者方法,以实现表与分区的对应关系。最后,我们可以使用消费者命令检查数据内容。

总结

将数据同步至 Kafka,还是之前的套路,区别点在于如何将复制进程当做客户端,当做生产者往 Kafka 对应的 topic 上生产数据。此外,Kafka 作为高吞吐量、低延迟、高并发的消息中间件产品,ogg 的同步进程甚至不需要考虑目标端的性能问题,只要往 Kafka 上推送数据,最终的数据使用则是另一端的消费者程序来使用数据。如果 Kafka 消费者程序可以连接到不同的数据库、不同的大数据开源组件进行数据的消费,那么就可以形成一个统一的模式,即 ogg_for_XXDB -> ogg_for_BigData -> Kafka -> 任意数据库。实际生产中的配置还包括涉及到安全认证的问题,在此省略。同时,我们也可以联想到基于 ogg 的数据操作闪回功能,结合数据变化的前后镜像,可以实现更多的可能性。

原创文章,作者:小编小本本,如若转载,请注明出处:https://www.benjiyun.com/yunzhujiyunwei/vps-yunwei/5943.html