从 PostgreSQL 迁移到 KaiwuDB
本节介绍了如何将 PostgreSQL 数据迁移到 KaiwuDB,涵盖配置示例和数据类型映射关系。
提示
KaiwuDB 时序表的第一列必须是时间戳列,且必须设置主标签列。迁移 PostgreSQL 数据的元数据到时序库时,KaiwuDB 会自动为表添加 ts
时间戳列作为第一列,添加 tb_name_tag
标签列作为主标签列。
手动创建时序表迁移 PostgreSQL 数据时,需要用户自行指定时间戳列和主标签列。
配置示例
本节提供了以下常见的迁移配置示例:
单库迁移元数据
前提条件
- 完成迁移准备。
- 在 PostgreSQL 数据库中创建
postgresql_kaiwudb
数据库和待迁移的表。 - 在 KaiwuDB 数据库中创建
postgresql_kaiwudb
时序库。
说明
- 目标数据库的库名必须与源数据库的库名相同。
- 如果登录 KaiwuDB 数据库的用户为
admin
用户或admin
角色的成员,则无需提前建库,KaiwuDB 将自动创建与源数据库同名的数据库。
步骤
解压缩 KaiwuDB DataX 插件包,将解压后的
kaiwudbwriter
复制到datax/plugin/writer
目录。创建
.yml
格式的迁移配置文件,配置元数据、源数据库和目标数据库。有关配置参数的详细信息,参见配置参数。metadata: enable: true # 启用元数据迁移 engine-type: TIMESERIES # 引擎类型为时序引擎 auto-ddl: true # 自动创建表 primary-key: false # 不启用主键迁移 constraint: false # 不启用约束迁移 comment: true # 启用注释迁移 index: false # 不启用索引迁移 view: false # 不启用视图迁移 source: type: POSTGRESQL # 源数据库是 PostgreSQL host: 192.168.122.67 # PostgreSQL 数据库主机地址 port: 3306 # PostgreSQL 数据库端口 username: <username> # PostgreSQL 数据库用户名 password: <password> # PostgreSQL 数据库密码 databases: - name: postgresql_kaiwudb # 源数据库名 target: type: KAIWUDB # 目标数据库是 KaiwuDB host: 127.0.0.1 # KaiwuDB 数据库主机地址 port: 26257 # KaiwuDB 数据库端口 username: <username> # KaiwuDB 数据库用户名 password: <password> # KaiwuDB 数据库密码 databases: - name: postgresql_kaiwudb # 目标数据库名
在
kaiwudb-datax-utils-2.2.0.jar
所在目录,执行以下命令,开始迁移表元数据。有关迁移命令支持的所有参数,参见迁移命令参数。java -jar -DyamlPath=../postgresql2kaiwudb.yml kaiwudb-datax-utils-2.2.0.jar
多表迁移指定范围的业务数据
前提条件
- 完成迁移准备。
- 在 PostgreSQL 数据库中创建
postgresql_kaiwudb
数据库和待迁移的表。 - 在 KaiwuDB 数据库中创建
postgresql_kaiwudb
时序库。
步骤
解压缩 KaiwuDB DataX 插件包,将解压后的
kaiwudbwriter
复制到datax/plugin/writer
目录。创建
.yml
格式的迁移配置文件,配置业务数据、源数据库和目标数据库。有关配置参数的详细信息,参见配置参数。data: enable: true # 启用业务数据迁移 batchSize: 1000 # 设置每次迁移的批量大小为 1000 条记录 setting: speed: channel: 1 # 设置数据迁移通道的速率为 1 errorLimit: percentage: 0.02 # 设置最大错误率为 2%,超过此比例将停止迁移 core: transport: channel: speed: byte: 1048576 # 设置每个传输通道的数据传输速度为 1MB(1048576字节) record: 1000 # 每次迁移的记录数为 1000 条 source: type: POSTGRESQL # 源数据库为 PostgreSQL url: jdbc:postgresql://127.0.0.1:5432/postgres_kaiwudb # PostgreSQL 数据库连接 URL username: <username> # PostgreSQL 数据库用户名 password: <password> # PostgreSQL 数据库密码 databases: - name: mysql_kaiwudb # 迁移源数据库名称 tables: - name: table_1 # 迁移的第一张表 column: ts,c1,c2,c3,c4,c5,c6,c7,c8,c9,c10,c11,c12,1 as t1 # 要迁移的列,指定 1 为主标签列 t1 where: ts >= '2024-08-01 00:00:00' and ts <= '2024-09-01 00:00:00' # 数据迁移条件,指定时间范围 - name: table_2 # 迁移的第二张表 querySql: - select ts,c1,c2,c3,c4,c5,c6,c7,c8,c9,c10,c11,c12,1 as t1 from table_2 where ts >= '2024-08-01 00:00:00' and ts <= '2024-09-01 00:00:00' # 自定义 SQL 语句,指定数据的迁移范围,指定 1 为主标签列 t1 target: type: KAIWUDB # 目标数据库为 KaiwuDB url: jdbc:kaiwudb://127.0.0.1:26257/postgres_kaiwudb # KaiwuDB 数据库连接 URL username: <username> # KaiwuDB 数据库用户名 password: <password> # KaiwuDB 数据库密码 databases: - name: mysql_kaiwudb # 目标数据库名称 tables: - name: table_1 # 迁移的第一张表 column: ts,c1,c2,c3,c4,c5,c6,c7,c8,c9,c10,c11,c12,t1 # 要迁移的列 preSql: - create table table_1 (ts timestamptz not null, c1 smallint, c2 int, c3 bigint, c4 float4, c5 float8, c6 bool, c7 char(1), c8 nchar(10), c9 varchar(10), c10 nvarchar(10), c11 varbytes(10), c12 timestamptz) tags (t1 int not null) primary tags (t1) # 在迁移数据前先创建表结构,表结构包含列定义和标签定义 - name: table_2 # 迁移的第二张表 column: ts,c1,c2,c3,c4,c5,c6,c7,c8,c9,c10,c11,c12,t1 # 要迁移的列 preSql: - create table table_2 (ts timestamptz not null, c1 smallint, c2 int, c3 bigint, c4 float4, c5 float8, c6 bool, c7 char(1), c8 nchar(10), c9 varchar(10), c10 nvarchar(10), c11 varbytes(10), c12 timestamptz) tags (t1 int not null) primary tags (t1) # 在迁移数据前先创建表结构,表结构包含列定义和标签定义
在
kaiwudb-datax-utils-2.2.0.jar
所在目录,执行以下命令,开始迁移表元数据和业务数据。有关迁移命令支持的所有参数,参见迁移命令参数。java -jar -DyamlPath=../postgresql2kaiwudb.yml -DdataxPath=../datax -Dpython=python kaiwudb-datax-utils-2.2.0.jar
数据类型映射
PostgreSQL | KaiwuDB 关系数据 | KaiwuDB 时序数据 |
---|---|---|
BIT | BIT | BOOL |
BOOL | BOOL | BOOL |
INT2 | INT2 | INT2 |
INT4 | INT4 | INT4 |
INT8 | INT8 | INT8 |
DECIMAL | DECIMAL | FLOAT8 |
NUMERIC | NUMERIC | FLOAT8 |
MONEY | DECIMAL | FLOAT8 |
FLOAT8 | FLOAT8 | FLOAT8 |
FLOAT4 | FLOAT4 | FLOAT4 |
DATE | DATE | TIMESTAMP |
TIME_STAMP | TIMESTAMP | TIMESTAMP |
TIMESTAMP | TIMESTAMP | TIMESTAMP |
TIMESTAMPTZ | TIMESTAMPTZ | TIMESTAMPTZ |
TIME | TIME | TIMESTAMP |
TIMETZ | TIMETZ | TIMESTAMPTZ |
BPCHAR, CHAR | CHAR | CHAR |
VARCHAR | VARCHAR | VARCHAR |
BYTEA | BYTES | VARBYTES |
BLOB | BYTES | VARBYTES |
VARBIT | VARBIT | VARCHAR |
TEXT | TEXT | NVARCHAR |
JSON | JSON | NVARCHAR |
JSONB | JSONB | NVARCHAR |
UUID | UUID | VARCHAR |
UNKNOWN | UNKNOWN | VARCHAR |