数据仓库的定义及特点
发布网友
发布时间:2022-04-21 18:29
我来回答
共3个回答
热心网友
时间:2022-04-13 00:57
数据仓库的定义及特点
一数据仓库定义
数据仓库之父Bill Inmon在1991年出版的“Building the Data Warehouse”一书中所提出的定义被广泛接受:数据仓库(Data Warehouse)是一个面向主题的(Subject Oriented)、集成的(Integrated)、相对稳定的(Non-Volatile)、反映历史变化(Time Variant)的数据集合,用于支持管理决策(Decision Making Support)。
对于数据仓库的概念我们可以从两个层次予以理解,首先,数据仓库用于支持决策,面向分析型数据处理,它不同于企业现有的操作型数据库;其次,数据仓库是对多个异构的数据源有效集成,集成后按照主题进行了重组,并包含历史数据,而且存放在数据仓库中的数据一般不再修改。
二数据仓库特点
1、面向主题。操作型数据库的数据组织面向事务处理任务,各个业务系统之间各自分离,而数据仓库中的数据是按照一定的主题域进行组织。主题是一个抽象的概念,是指用户使用数据仓库进行决策时所关心的重点方面,一个主题通常与多个操作型信息系统相关。
2、集成的。面向事务处理的操作型数据库通常与某些特定的应用相关,数据库之间相互独立,并且往往是异构的。而数据仓库中的数据是在对原有分散的数据库数据抽取、清理的基础上经过系统加工、汇总和整理得到的,必须消除源数据中的不一致性,以保证数据仓库内的信息是关于整个企业的一致的全局信息。
3、相对稳定的。操作型数据库中的数据通常实时更新,数据根据需要及时发生变化。数据仓库的数据主要供企业决策分析之用,所涉及的数据操作主要是数据查询,一旦某个数据进入数据仓库以后,一般情况下将被长期保留,也就是数据仓库中一般有大量的查询操作,但修改和删除操作很少,通常只需要定期的加载、刷新。
4、反映历史变化。操作型数据库主要关心当前某一个时间段内的数据,而数据仓库中的数据通常包含历史信息,系统记录了企业从过去某一时点(如开始应用数据仓库的时点)到目前的各个阶段的信息,通过这些信息,可以对企业的发展历程和未来趋势做出定量分析和预测。
企业数据仓库的建设,是以现有企业业务系统和大量业务数据的积累为基础。数据仓库不是静态的概念,只有把信息及时交给需要这些信息的使用者,供他们做出改善其业务经营的决策,信息才能发挥作用,信息才有意义。而把信息加以整理归纳和重组,并及时提供给相应的管理决策人员,是数据仓库的根本任务。因此,从产业界的角度看,数据仓库建设是一个工程,也是一个过程。
热心网友
时间:2022-04-13 02:15
数据仓库,英文名称为Data Warehouse,可简写为DW或DWH。数据仓库,是为企业所有级别的决策制定过程,提供所有类型数据支持的战略集合。它是单个数据存储,出于分析性报告和决策支持目的而创建。 为需要业务智能的企业,提供指导业务流程改进、监视时间、成本、质量以及控制。
我简单的做一个比喻,数据仓库就是可以理解就是一个使用仓库,数据就是这个仓库的货物,而数据仓库的开发人员就是这个仓库的管理员,所以数据仓库就是一个怎么管理好数据,使得数据规范的放在仓库中,便于BI、AI等其他的使用数据的方面可以更好的使用仓库里面的数据,使得数据发挥出更好的价值,显而易见在一堆有规律,整齐的货物里面找一个东西,要比在没有整理的里面找更加有效率。
数据仓库是决策支持系统(dss)和联机分析应用数据源的结构化数据环境。数据仓库研究和解决从数据库中获取信息的问题。数据仓库的特征在于面向主题、集成性、稳定性和时变性。
可以参考这篇文章:数据仓库(1)什么是数据仓库 - 知乎 (hu.com)
热心网友
时间:2022-04-13 03:50
(1)安全性,在网络层和后端数据仓库,基于桌面的授权控制,防范有意或偶然的攻击和破坏。
(2)健壮性,能适应不断变化的商业规则和环境,允许进行有效的修改、指导和管理。
(3)可移植性,系统的组件无须大量修改就可以在软硬件上安装。
(4)开放性,使用公开的标准,独立于某个主导企业,或在主要的技术设计上代表事实标准,应用程序接口通过更改控制来发布和修改。
(5)一致性,单独的组件有定义良好的接口,不受其他组件实现改变的影响。
(6)可维护性,通过对由于环境的变化而改变或磨损的特性进行常规检查,系统的生命周期可以延长或不确定。
(7)可扩展性,系统组件可用于新的、不可预见的环境和状况。
(8)工具化,系统有内置传感器或数据收集设备,这样,如果出现问题,无须做大量工作就可以进行诊断。
(9)可重用性,组件定义良好,可以进行配置管理,并被证明可以用于其他环境。
(10)连通性,信息和功能可以通过预定义的接口、路径和系统其他地方的连接,包括跨分布式节点的连接得到。
(11)可缩放性,当增加系统组件来处理增大的数据量、用户和处理需求时,系统性能提高,并呈线性或近似线性增长。
(12)灵活性,面对不断发展的商业环境,性能逐渐恶化,但不会突然崩溃,有时间等待人们进一步改正。
基于这些特点,数据仓库在现在网络时代应用是非常广泛的,同时也带来了很多方便。