1. 本际云推荐 - 专业推荐VPS、服务器,IDC点评首页
  2. 云主机运维
  3. VPS运维

使用dataX批量从ob迁移表到oracle

使用DataX批量从OB迁移表到Oracle

作为际云服务器推荐网的小编小本本,为了实现核心系统业务部分业务迁移到国产数据库OceanBase,需要将历史数据迁移到Oracle数据库。考虑到数据实时性不高,只需要完成一个月的数据迁移即可。之前使用了OMS迁移,但因为不支持单个分区的迁移只能全表迁移,导致迁移时间较长。为了解决这个问题并备份后续要迁移到国产数据库的业务,考虑使用DataX批量迁移数据。

使用dataX批量从ob迁移表到oracle

DataX简介

DataX是阿里巴巴集团内被广泛使用的离线数据同步工具,支持各种异构数据源之间的稳定高效的数据同步功能。DataX采用Framework+plugin架构,将数据源读取和写入抽象成为Reader/Writer插件,并通过Framework连接两者,作为数据传输通道,并处理缓冲、流控、并发、数据转换等核心技术问题。

使用DataX批量迁移数据的步骤

使用DataX进行批量迁移数据需要通过以下步骤:

1. 在Oracle创建目标表的表结构

在使用DataX同步数据之前,需要先在目标端Oracle数据库中创建相应的表结构。在这里可以使用OMS直接从OB迁移表结构到Oracle。

2. 创建配置文件(JSON格式)

创建配置文件时,需要使用JSON格式,主要由setting和一个reader和一个writer组成。批量配置JSON可以设置channel参数控制任务并发数、bytes参数控制每秒字节数、record参数限制出错记录数等。

3. 使用变量${readTb}表示表名并进行传输

DataX的基本执行语句为python  {DATAX_HOME}/bin/datax.py  {JSON_FILE_NAME}.json,传输时可使用-D参数进行设置,使用变量${readTb}表示表名。

4. 并发参数Channel的实现

DataX的并发参数Channel是通过生成多个SQL语句实现的,因此Channel参数仅在能够split出多个SQL语句的场景下生效,也就是table模式+spliPk下具有实际意义。在table模式下,Channel个数决定Reader和Writer的个数上限,如果指定了spliPk字段,DataX会将MySQL表中的数据按照

原创文章,作者:小编小本本,如若转载,请注明出处:https://www.benjiyun.com/yunzhujiyunwei/vps-yunwei/6452.html