发表于2018年13月21日10:58最后回复于2018年13月21日10:58

数据仓库&数据库你了解多少?

2215浏览量

0评论

       今天我们要说的是主题是——数据仓库,注意是仓库,不是数据库哦。

       首先我们要知道,数据仓库的建立为行业高层主管门系统的地组织、理解和使用他们的数据进行了战略决策提供了体系结构和工具。在当今充满竞争和快速发展的世界,数据仓库系统是一种有价值的工具。在过去的几年中,许多公司花费数百万美元建立企业范围的数据仓库。许多人都感到随着工业竞争的加剧,数据仓库成了必备的最新营销武器——一种通过更多的了解客户需求而留住客户的途径。

图片1

      “那么,到底是什么是数据仓库?”数据仓库已被多种方式定义,很难给出一种严格的定义。不严格的讲,数据仓库是一种数据库,它与组织机构的操作数据库分别维护。数据仓库系统允许将各种应用系统集成在一起,为统一的历史数据分析提供坚实的平台,对信息处理提供支持。按照一位数据仓库系统构造方面的领头设计师William H.Inmon的说法,“数据库是一个面向主题的、集成的、时变的和非易失的数据集合,支持管理部门的决策过程”[Inm96]。这个简短而又全面的定义指出了数据仓库的主要特征。

   

       四个关键词,面向主题的、集成的、时变的、非易失的,将数据仓库与其他数据存储系统相区别。让我们进一步看看这些关键特征。

       面向主题的:数据仓库围绕一些主题,如顾客、供应商、产品和销售来组织。数据仓库关注决策者的数据建模与分析,而不是组织机构的日常操作和事务处理。因此,数据仓库排除对于决策支持过程无用的数据,提供特定主题的简明视图。

       集成的:通常,构造数据仓库是将多个异构数据源,如关系数据库、一般文件和联机事务记录集成在一起。使用数据清理和数据集成技术确保命名约定、编码结构、属性度量等的一致性。

      时变的:数据存储从历史的角度提供信息,数据仓库中的关键结构都隐式或显式地包含时间元素。

      非易失的:数据仓库总是物理地分别存放数据,这些数据源于操作环境下的应用数据。由于这种分离,数据仓库不需要事务处理,恢复和并发控制机制。通常,它只需要两种数据访问操作:数据的初始化装入和数据访问。

       概言之,数据仓库式语义上一致的数据存储,它充当决策支持数据模型的物理实现,并存放企业战略决策所需要的信息。数据仓库也常常看作一种体系结构,通过将异构数据源中的数据集成在一起而构造,支持结构化和/或专门的查询、分析报告和决策制定。

图片2

       根据上面的讨论,我们把建立数据仓库看作构造和使用数据仓库的过程。数据仓库的构造需要数据集成、数据清理和数据统一。利用数据仓库常常需要一些决策支持技术。这使得“知识工人”能够使用数据仓库快捷、方便的得到数据的总体视图,根据数据仓库中的数据信息做出准确的决策。

       由于大多数人都熟悉商用关系数据库系统,将数据仓库与之比较,就容易理解什么式数据仓库。

       联机操作数据库系统的主要任务是执行联机事务和查询处理。这种系统称作联机事务处理(OLTP)系统。它们涵盖了组织机构的大部分日常操作,如购物、库存、制造、银行、工资、注册、记账等。另一方面,数据仓库系统在数据分析和决策方面为用户或知识工人提供服务。这种系统可以用不同的格式组织和提供数据,以满足不同用户的各种需求。这种系统称作连接分析处理(OLAP)系统。

        OLTP和OLAP的主要区别概述如下。

       用户和系统的面向性:OLTP系统是面向客户的,用于办事员、客户和信息技术专业人员的事务和查询处理。OLAP系统是面向市场的,用于知识工人的数据分析。


       数据内容:OLTP系统管理当前数据。通常,这种数据太琐碎,难以用于决策。OLAP系统管理大量历史数据,提供汇总和聚集机制。并在不同的粒度级别上存储和管理信息。这些特点使得数据更容易用于见多识广的决策。

       数据库设计:通常,OLTP系统采用实体-联系(ER)数据模型和面向应用数据库设计。而OLAP系统通常采用星形或雪花模型和面向主题的数据库设计。

       视图:OLTP系统主要关注企业或部门内部的当前数据,而不涉及历史数据或不同的组织的数据。相比之下,由于组织的变化,OLAP系统常常跨越数据库模式的多个版本。OLAP系统还处理来自不同组织的信息,有多个数据存储集成的信息。由于数据量巨大,OLAP数据存放在多个存储介质上。

       访问模式:OLTP系统的访问模式主要由短的原子事务组成。这种系统需要并发控制和恢复机制。然而,对OLAP系统的访问大部分是只读操作,尽管许多可能是复杂的查询。

       OLTP和OLAP的其它区别包括数据大小、操作的频繁程度、性能度量等。

       好了,今天的科普就说到这里,你懂了吗?



私信

举报