物理模型就像大厦的基础架构,数据仓库的数据从几百字节到几十太字节不等。支撑这些数据的关系数据库管理系统无论有多么强大,仍不可避免地要考虑到数据库的物理设计。物理模型是逻辑模型中各种实体表的具体化,例如表的数据结构类型、索引策略、数据存放位置以及数据存储分配等。在进行物理模型设计时,要考虑空间利用率和维护代价等方面。
为确定数据仓库的物理模型,设计人员必须开展以下几方面工作:①确定项目资源,定义数据标准。根据预算和业务需求,并参考以往的数据仓库项目经验,对该项目的成本、周期和资源进行估算,规范化数据仓库中的数据。②确定软硬件配置。数据仓库的处理能力和容量息息相关,也和具体的关系数据库的性能息息相关,既要考虑实际的预算,也要视实际的需求而定。关于硬件的配置,既需要发挥软件的功能,满足实际的处理要求,也要为将来的系统扩展保留一定的空间。③全面了解所选用的数据库管理系统,特别是存储结构和存取方法。了解数据库架构,如关系数据库的关系模型、星型模型、多维数据库的Cube等,以及具体的数据库管理系统软件和版本等。④根据具体使用的数据库管理系统,将实体和实体特征物理化,具体包括字段设计、物理记录设计、反规范化设计(提高查询性能)等。⑤了解数据环境、数据的使用频率、使用方式、数据规模及响应时间要求等,这些都是对时间和空间效率进行平衡优化的重要依据。⑥了解外部存储设备的特征,只有这样才能在数据的存储需求与外部存储设备条件之间获得平衡。