Data Vault是一种数据仓库建模方法,偏向于对基础组织,在处理分析场景时较复杂,在大数据仓库中可用来在数据湖建模。
不同于ER模型、维度模型,Data Vault模型主要用于存储来自多个业务系统的完整的历史数据。它不区分数据在业务层面的准确与否,装载数据也不做验证和清洗,因此,Data Vault模型可用于跟踪所有数据的来源。
Data Vault模型由中心表(Hub)、链接表(Link)、卫星表(Satalite)三部分构成,其核心是中心表,用于存储业务主键,链接表用于存储业务关系,卫星表用于存储业务描述。
1) 中心表:用于存储企业每个业务实体的业务主键
2) 链接表:是不同中心表之间的关系链接,链接表一般由一组外键字段构成
3) 卫星表:用于保存中心表和链接表的描述属性,附属表有且仅有一个唯一外键关联到中心表或链接表。