本期直播我们邀请到 KaiwuDB 高级研发工程师边旭霞老师,为大家介绍《数据库自治平台 KAP 监控告警架构及实例演示》。边旭霞老师具备丰富的大数据分析和运维经验,曾负责数据运营管理平台的原型设计与开发等重点项目,现主要负责 KAP 的原型设计及研发管理工作。
直播重点回顾
01KAP 监控告警功能介绍 KAP 是KaiwuDB 的自治服务工具,在 KAP 中监控主要是帮助用户全面掌握KaiwuDB 集群的整体运行情况,实时监测集群相关性能,并支持定制化的模板展示各种指标数据。 在告警管理中系统可以根据配置的规则、订阅、通知等信息进行告警,帮助用户及早发现问题、解决问题,从而提高被监控集群持续服务的能力,有效保障数据库服务的稳定性、安全及可靠性。 02监控告警的技术架构KAP 的监控告警实现了多集群监控指标及日志的采集、存储,支持平台监控展示和告警监测和推送。具体流程如下图所示: 03监控实现(1)metric 指标采集metrics 由 metric name 和 label name 组成。{=,…},存储相关指标名称如下表所示: