本期直播我们邀请到 KaiwuDB 高级研发工程师冯友旭为大家分享《KWDB 分布式架构探究——数据分布与特性》,点击下方视频观看完整版回放 ↓↓↓
KWDB 分布式架构探究——数据分布与特性
以下为重点内容节选,点击上方视频查看完整版内容。
数据分布在数据库中的作用至关重要,它直接影响到数据库系统的性能、可扩展性、可用性、管理效率和成本。特别是在处理海量数据和高并发请求的现代应用中,合理的数据分布策略是数据库架构设计的核心。本期直播重点讲解了数据分布在分布式数据库中的重要性、 KWDB 数据库分布式架构设计方案、特性及具体实践案例。
数据分片 Range 的逻辑概念是数据的子集,代表数据分片/迁移及高可用操作的最小单元。
关系数据:按照 Key 进行的 Range 分布。
时序数据:按照按照设备 Hash 进行的 Range 分布。
支持历史 Range 的 Merge 规则,通过 alter merge day 进行设置。
优势:
Hashpoint:根据 primaryTag 或 primaryTag/TimeStamp,通过 Hash (key)%HashNum 所计算出来的 Hash 值。
ALTER {RANGE DEFAULT | DATABASE db_name | TABLE tb_name} CONFIGURE ZONE USING rebalance;
作用范围:
考虑元数据的膨胀系数以及集群的读写性能的稳定性。
建议:16C/32G 3 节点集群 Range 总数量不超过 1000 ,5 节点集群 Range 总数量不超过 3000,增加一个节点增加 Range 数量不超过 500。
优化策略: