KaiwuDB 数据迁移工具

产品概述

KaiwuDB 数据迁移工具（KaiwuDB Data Transformer，简称 KDTS）是基于 DataX 框架开发的企业级异构数据库迁移解决方案。该工具提供图形化操作界面，支持多种主流数据库到 KaiwuDB 的数据迁移和同步，帮助用户快速、安全地完成数据资产转移。

KDTS 支持以下数据源到 KaiwuDB 3.x 的迁移：

KDTS 提供三种核心迁移模式，满足不同业务场景的需求：

KDTS 支持多种迁移粒度，用户可根据实际业务需求灵活选择：

下表展示不同源数据库到 KaiwuDB 可选择的迁移模式和迁移粒度：

数据库类型	源数据库	目标引擎	结构迁移	数据迁移	混合迁移
关系数据库	MySQL	关系	表/库	表/库	表/库
	MySQL	时序	表	表	表
	PostgreSQL	关系	表/库	表/库	表/库
	PostgreSQL	时序	表	表	表
	Oracle	关系	表/库	表/库	表/库
	Oracle	时序	表	表	表
	ClickHouse	关系/时序	-	表	-
	SQL Server	关系/时序	-	表	-
时序数据库	TDengine 2.x/3.x (< 3.3.3.0)	关系/时序	-	表	-
	TDengine 3.3.3.0+	关系	-	表	-
	TDengine 3.3.3.0+	时序	表	表	表
	InfluxDB 1.x	关系/时序	-	表	-
	InfluxDB 2.x	关系	-	表	-
	InfluxDB 2.x	时序	表	表	表
	OpenTSDB	关系/时序	-	表	-
	KaiwuDB 2.x/3.x	关系/时序	-	表	-
其他数据源	MongoDB	关系/时序	-	表	-
	FTP	关系/时序	-	表	-
	HDFS	关系/时序	-	表	-

不同数据库的数据类型和处理机制存在差异。下表详细说明了 KDTS 处理各类数据库的方式和注意事项：

数据库	数据处理说明
ClickHouse	- NULL 值迁移至 KaiwuDB 后会被处理为 `false` - 二进制类型数据迁移后以 `\x+` 空字符串的形式显示
MongoDB	- 不支持迁移 MongoDB 的 `_id` 系统字段
OpenTSDB	- OpenTSDB 采用键值对数据模型，读取时数据以键值对形式呈现 - 支持自动转换 metric 名称：将句点（`.`）替换为下划线（`_`）作为 KaiwuDB 表名 - 每张表包含 `k_timestamp`（时间戳）和 `value`（数值）两个标准列 - 当目标表不存在时，支持自动创建表结构
TDengine	- BOOL 类型的 `null` 值迁移后处理为 `false` - NCHAR 类型的 `null` 值迁移后显示为空字符串 - 不支持 JSON 数据类型：如果表的标签列采用 JSON 格式，需要预先转换为其他支持的数据类型