数据仓库是为了有效地将操作型数据集成到统一的环境中,以提供决策型数据访问的各种技术和模块的总称。数据仓库作为一种将数据转换为信息、知识的技术手段,能够为用户提供用于决策支持的当前和历史数据,被认为是商业智能的核心组件。
面向主题的、集成的、稳定的、反映历史变化的数据集合。又称“企业数据仓库”。
数据仓库是为了有效地将操作型数据集成到统一的环境中,以提供决策型数据访问的各种技术和模块的总称。数据仓库作为一种将数据转换为信息、知识的技术手段,能够为用户提供用于决策支持的当前和历史数据,被认为是商业智能的核心组件。
数据仓库具有四个显著特点。①主题性。主题是一个在较高层次将数据归类的标准,数据仓库中每一个主题对应一个宏观的分析领域。②集成性。在数据进入数据仓库之前,必须进行数据加工和集成,这是建立数据仓库的关键步骤,首先要统一原始数据中的矛盾之处,还要将原始数据结构做出从面向应用向面向主题的转变。③稳定性。数据仓库反映的是历史数据的内容,而不是日常事务处理产生的数据,数据经加工和集成进入数据仓库后是很少修改或根本不修改的。④历史性。数据仓库是不同时间的数据集合,它要求数据仓库中的数据保存时限能满足进行决策分析的需要,而且数据仓库中的数据都要标明该数据的历史时期。
数据仓库与传统数据库不同,它并非一个仅仅存储数据的简单数据库,它实际上是一个以大型数据管理信息系统为基础,存储企业所有业务数据库中获取的综合数据,并能够利用这些综合数据为用户提供经过处理后的有用信息的应用系统。数据仓库的要求是能够准确、安全、可靠地从数据库中取出数据,经过加工转换成有规律信息之后,再供管理人员进行分析。
组织机构的联机事务处理系统所累积的大量资料,通过数据仓库理论所特有的资料储存架构,可以进行系统地分析整理,以利于各种分析方法如联机分析处理、数据挖掘的进行,进而支持如决策支持系统、主管资讯系统的创建,帮助决策者快速有效地从大量资料中,分析出有价值的资讯,以利于决策拟定及快速回应外在环境变动,帮助建构商业智能。
为了更好地为前端应用服务,数据仓库最根本的特点是物理地存放数据,而且这些数据并不是最新的、专有的,而是来源于其他数据库,它要建立在一个较全面和完善的信息应用的基础上,用于支持高层决策分析,而事务处理数据库在企业的信息环境中承担的是日常操作性的任务。数据仓库是数据库技术的一种新的应用,21世纪初期的数据仓库用数据库管理系统来管理其中的数据。