10月28-29日,第八届中国开源年会(COSCon's23)在四川成都高新区菁蓉汇成功举办。作为开源领域的年度盛会,本次以“开源:川流不息、山海相映”为主题,吸引了众多行业学者、技术专家、开源爱好者的共同到场,KaiwuDB CTO 魏可伟受邀于主论坛发表《万物互联,探索新一代数据底座》主题演讲。
即通过分析数据行为和查询模式,提前准备数据并优化聚合操作,从而提升查询性能。以时序数据场景为例,会以时间维度进行数据的聚合分析,这背后的一项关键技术就是智能预计算—即利用 AI 大脑预判用户会对哪些内容会做聚合分析,提前把结果“知识”计算好。
这一能力可快速实现结果反馈,极大程度提升性能;在生命周期管理方面,也可以通过 AI 对用户使用情况做出预判,如果 AI 预判用户对某一类数据不再频繁调用,可以自动挪到冷存储上,降低资源占用。
在IoT 领域有一些常见的算法,比如常见的时间序列预测、图像识别等,这些都是我们在 AIoT 领域中比较关心的话题;与此同时,我们还需要解决数据库和 AI 两大生态割裂的问题,即如何实现从数据库里的数据产生的模型能够在数据库里用起来,同时避免让数据工程师、数据科学家们觉得有很多额外负担。
为此,KaiwuDB 提供了原生预测分析能力。我们希望提供一个平台,能够实现数据库和算法的紧密结合。比如,支持数据库中的函数调用平台上的模型训练、模型推理等能力。这样从数据库开发人员和管理人员的操作层面来看,他们相当于只在使用我们数据库的一个基本能力,并不会产生额外负担。另一方面,我们也可以为数据科学家开放接口,让他们能够把训练出来的模型,放进数据库中。通过上述方式,可以把各类数据库相关人员紧密联系起来。
DB 赋能 AI
此外,我们还提供一项生命周期管理引擎能力—Modelops in Database。举个例子:我们的 AI 模型,它本身是有时效性的。比如,用去年的数据训练出来的模型,今年未必适用。这个时候谁能够第一时间发现这个问题?应该是数据库。因为当我们发现数据分布已经发生明显的变化的时候,可以推测出该模型的性能可能也将处于风险之中,这个也是 KaiwuDB 在做 DB For AI 的关键思路。
魏可伟在开源年会发表演讲
KaiwuDB 作为一款多模数据库,一个很重要的核心是用一体化的方式、统一的接口提供给用户数据管理和处理的能力。“大模型给我们带来一个非常好的机会,让我们真正地去实现一个完全不同的多模数据库”,魏可伟表示。
就数据库而言,开源和创新一直是密不可分的。回顾整个数据库发展历程,创新至关重要,而开源是引领创新的重要途径。未来,KaiwuDB 将努力为各位伙伴提供更开放智能的数据库解决方案,后续我们也会有开源计划,敬请大家期待!