本文中包含的信息代表了微软公司在发布之日对所讨论的一些问题的当前观点。由于微软公司必须对变化的市场条件作出反应,所以不应将本文解释为微软公司的一个承诺,而且微软公司不能保证自发布之日后出现的任何信息的准确性。
本文档只用于资料用途。在本文档中,微软不做任何担保,无论明示还是暗示。
1998 微软公司。保留所有权利。
简介 以更快的速度做出更好的商业决策是在当今布满竞争的市场中取得成功的要害。组织机构寻求提高决策能力的努力被来自众多运营和生产系统的大量、复杂的数据所沉没。对于当今的信息技术专业人员来讲,确保数据的可访问性是最具挑战性的任务之一。
为应付这一挑战,许多组织机构选择建立数据仓库来挖掘隐藏于OLTP系统中的有用信息。数据仓库对那些来自作为决策支持和数据分析基础的各系统所拥有的信息进行集中存储。虽然基于不同的设计方法和学术理念,存在多种类型的数据仓库,但它们都有下列共同的特性:
· 围绕公司考虑的主要问题(如客户、产品、销售或供货商)来组织信息,这反映了数据驱动的设计思想。
文章来源于www.jc567.cn
· 从非集成运行的和传统的应用软件中收集原始数据,经过筛选、综合后以某种有意义的方式提交给最终用户。
· 基于最终用户的反馈意见和在数据仓库中的发现,数据仓库的体系结构将随时间而不断变化,这反映了该处理过程所具有的反复性。
因此数据仓库过程本质上来讲是复杂、昂贵且耗时的。在过去的几年中,微软公司一直致力于与其他软件公司一起以创建由组件技术和先进产品组成的数据仓库平台,这些技术和产品能用来降低费用、提高数据仓库创建、治理和使用的有效性。同时微软公司也一直致力于开发大量的产品和工具,如Microsoft? SQL Server? 7.0版,以很好地配合数据仓库过程(data warehousing process)。通过与那些能与微软数据仓库框架集成使用的第三方产品相结合,客户就能从大量的可互用的、最佳的产品中选择适应自己数据仓库所需的产品。
SQL Server 7.0提供了广泛的功能以支持数据仓库过程。微软公司并为数据仓库发行了一个平台与Data Warehousing Framework结合起来使用,以降低费用和复杂性,并提高数据仓库工作的效率。
数据仓库过程(Data Warehousing Process) 从信息技术的观点来看,数据仓库关心的是在一个组织机构中将适当的信息传送到适当的个人手中。这是一个正在进行的过程,而不是以前的解决方案,并且需要不同的方法以满足面向事务系统开发工作的需求。
007网络教程网 数据仓库是数据的集合,以对那些面向主题的、集成的、时间不同的、非易失性的决策的治理工作给以支持。数据仓库关注的是概念(如销售),而不是过程(如提供发票)。它包括从多种处理系统收集到的有关某一概念的所有相关信息。信息进行定期收集和存储,并且是相对稳定的。
通过一致命名约定、测量、物理属性和语义,数据仓库对操作数据进行集成。在数据仓库物理设计的第一步是确定应包括哪些主题领域,并开发一套意见一致的定义集。这需要约见最终用户、分析员、高级治理人员,以了解所需信息的范围,并给出相应文档。在将逻辑处理转化成物理数据仓库之前,必须对相关问题有彻底的了解。
在物理设计之后,是在运作系统基础上产生数据仓库。因为运作系统和数据仓库包含不同的数据类型,所以将数据载入数据仓库需要进行数据的转换:汇总、转换、解码、去除非法数据等等。这些过程需能自动完成以便在变化的基础上也能完成:经常需要对源数据进行抽取、转换和移动以满足数据仓库的商业需求。
在运作系统中,当存取数据时,数据应有具有数值,并且数据是精确的。.例如,一个订单输入系统总是为手头存有的每一产品提供当前价格。这样仅仅是时间稍有差别的两个查询所获得的价格就有可能不同。在数据仓库中,数据表示在很长一段时期收集到的信息,作为某一特定时间点来讲是精确的。因此,数据仓库包含有关商业要害领域的一系列"快照" (snapshot)。
www.jc567.cn 最后,信息用于浏览、分析和报告。有许多有助于分析的工具(从简单的用于写报表的程序到高级的用于数据挖掘的程序)。最后,分析程序使数据仓库过程的最终结果和数据仓库设计的修改都能适应新的要求,并提高系统性能或答应进行其它新类型的分析。由于这些变化,处理过程会重新开始,并延伸到数据仓库的整个生命周期。
数据仓库体系结构 目前已提出了许多方法,来简化在变化的基础上支持数据仓库过程所需的信息技术。这引发了哪一种体系结构是在组织机构中部署数据仓库的最佳体系结构的争论。
数据仓库有两种基本类型:企业级数据仓库和数据集市(data marts)。
企业数据仓库包括企业范围的信息,这些用于集中地进行数据分析的信息来自多个业务业务系统源数据。典型地,这些信息包括几个主题领域,如客户、产品和销售,并用于制定企业战术上和战略上的决策。 企业数据仓库包括具体的某一时间点数据和经过概括总结的信息,数据大小从50GB到超过1TB。企业数据仓库可能是非常昂贵的,并且在安装和治理方面是很耗时间的。通常由集中式信息服务组织自上而下地创建。
www.jc567.cn 数据集市包含企业范围数据的一个子集,这个子集是为组织机构的个别部门或公司使用而创建的。 数据集市与企业数据仓库不同,它是由为非凡决策支持软件或用户组使用的部门资源自上而下建立的。数据集市包含经过汇总的和有关某一主题领域的具体数据。数据集市的信息可能是企业数据仓库的子集(依靠性的数据集市)或可能直接来自业务系统源数据(独立的数据集市)。
企业数据仓库和数据集市是结构化的,并在前面所述的处理过程中保持不变。并且,两种方法共享一套相似的技术组件。
数据仓库组件 数据仓库包括许多组件,如:
· 业务系统源数据
· 设计/开发工具
共7页: 上一页 1 [2] [3] [4] [5] [6] [7] 下一页