元数据是关于数据的组织、数据域及其关系的信息,简言之, 元数据就是关于数据的数据。在元数据平台建设过程中同样存在很多问题如,要计算的指标可以依赖哪些数据,某一个数据的口径是什么?如何准确高效地梳理出数据间或是任务间的上下游关系,并识别出关键生产链路?
资源治理、规范治理等靠什么来驱动?如何衡量治理的效果?这些都是在平台建设过程中迫切需要解决的问题。
元数据系统发展及现状

如何抽象和管理

元数据属性分类
元数据的主要属性分为四类,基础元数据是引擎或平台提供的基本信息,一般直接从平台接入。资产元数据是在生产过程中由开发者维护的资产画像信息。安全元数据是安全相关的数据,来自安全中心。衍生元数据由上述三个类型基础、资产、安全等其他的元数据衍生而来。

当前架构系统
接收层:适配不同元数据生产方,转换成标准定义;输出全种类实体、关系变更消息
服务层:基于存储层提供单点、复杂查询服务;基于分析引擎提供分析服务
存储层:基于图模型的实体、关系的存储与查询支持;统计与分析

类型系统

应用场景:找数

应用场景:全链路血缘

应用场景:数据治理平台
