mysql多维数据仓库指南
举荐课程:MySQL教程。
数据仓库可以通过集成各种多样的数据实现信息的同一,这些数据来源包含现行的事务操纵和治理信息系统,以及外部各种信息源。这些源数据将被整合,清洗,转换,要是需要直接从这些数据来源读取数据的话,该数据将会在数据仓库中以更有益于操纵的方式存储。
数据仓库的数据结构方式使你可以存储目前和历史的数据。目前数据是现实事务操纵流动须要的,个别是按期的硬拷贝(比方打印出的报表)或者是联机报表。而历史数据,往往不是那么容易应用,可以供给基于工夫点剖析的商业信息,比方:追踪、推论剖析,以及对照,这些关于长期规划和策略性的市场决策都是很重要的。
怎样从多个信息源整合信息,按期积聚存储,有效的需求设计和开展技术,所有这些都和事务型治理信息系统所利用的技术有很大的不一样。本书都是对于数据仓库的设计和开发技术,它涵盖了大局部创立数据仓库所波及到的大局部技术题目。更为重要的是,本书供给了一个易懂的操纵指南,便于开发一个现实的数据仓库。
本书的适用范畴
mysql多维数据仓库指南是一个实战的书籍。你将运用mysql数据库,但该书不是对于mysql的。本书不波及任何硬件架构方面的题目。
本书主要体贴数据仓库的设计和开发技术。它不波及开发项目的治理,理论,以及怎样向导开发等相干的技术题目。
本书用一个数据仓库开发的例子来展现技术怎样利用。供给数据模型和sql足本,将能够适用于现实的数据仓库开发。这些足本已经在Windows xp professional sp2 平台上用mysql 5。0。21 版本测试通过。
别的,本书不再对下列的几个主题进行特殊的叙述:
数据仓库的概念
Sql
MySQL数据库
适合浏览本书的人:
数据仓库利用于各种组织和商业机构,执政府部门,非盈余组织到学校,从创造业到销售店,从金融机构到医疗机构,从传统企业到互联网商家。
本书第一面向数据仓库开发人员。但是,it 经理和其他it职业,特殊是那些对mis(运营汇报)和dss(决策支持利用)感乐趣的人将发明本书一样实用。总的说来,本书是给那些为剖析利用预备数据工作相干的人,以及那些需要递交信息的人,比方打印报表,联机报表。
本书一样适用于那些数据仓库初学者。它将直接迅速的为那些正在预备开发他们首先个数据仓库的人供给帮忙。
先生和学生可以将该书作为教科书,以便于明白他们关于数据仓库道理,概念的了解。大局部章节可以被定制用于实验训练。
准备的技能
本书不是面向it新人,为了更有效的应用本书,读者必需有一些系统开发经验。但是,不请求先有数据仓库的建设经验。
需要实践操纵本书例子的人需要有rdbms(关系数据库治理系统)和sql的现实操纵技能。
你可以从本书得到
你将可以仅仅用一个示例,一个最先存储商业零售相干数据的数据仓库,而且进行实践操纵,就可以磨难你的数据仓库见识和现实技能。该示例是一个精简版的现实数据仓库,可以在许多种商业类型中寻到它的原型。
你将基于mysql数据库用本书介绍的技术一步步的开发该示例中零售相干数据仓库。这些技术是在平常数据仓库开发中将遇到的题目的分解技巧。通过完老本文的学习而且完成所有的训练,你将获得相干工作经验并可认为负责首先个现实数据仓库项目做好预备。
章节总览
本书包括25个章节和一个附录。所有章节组织为四个局部。首先局部涵盖数据仓库根基。第二局部描述从原始数据到数据仓库的迁移。第三局部计议怎样控制数据仓库的开展演化。第四局部波及到一些高级的多维技术。接下来的局部将给出每个章节的预览。
首先篇 根本道理
首先篇,涵盖多维数据仓库的根基道理,有四个章节。
第1章,“根本组成”,介绍星型模式(一种数据库模式,有一个事实表,四周环绕着多个维表)以及解释该模式的根本组成。
第2章,”维度历史“ 介绍用代理健来保护维成员的历史记载。
第3章,“度量可加性”,包括维度数据仓库中最重要的特性之一,也就是存储在数据仓库事实表中的度量的可加性。
第4章,“维度查询”,介绍最适合利用于星型模式的一种sql查询,维度查询可以用来证实一个维度数据仓库可否具备两个最根本的设计目标:简略和高效。
第二篇: 提取、转换和加载
该篇的所有5个章节波及了数据集成,事实表,维表。
第5章,“源数据提取”介绍了不一样类型数据的提取。
第6章“导入工夫维”涵盖了三种最通用的加载工夫维的技术。
第7章 “初始化导入“和第8章,“按期导入”波及到两品种型的导入技术,初始化和周期性。
第9章,“周期导入规划”,作为第二篇的总结,供给一个进阶式的引导,对于怎样应用Windows的任务治理器实现按期导入规划。
第三篇:成长
第三篇介绍了不一样的处置技术,这些技术主要处置一个成功的多维数据仓库成长历程中遇到的相干题目。该局部有十个章节。
第10章,“添加字段”计议对于向现有数据仓库中的表添加一个字段的技术题目。
第11章,“按需载入”波及按需载入的技术。
第12章,“维表子集”,介绍相干技术以帮忙会员处置维表子集题目。
第13章,“维度角色饰演”,对于在一个事实表中屡次运用统一个维度的题目。
第14章,“快照”让你在需要作出汇总数据的时候,能供给迅速机能的查询。
第15章,“唯度条理”和第16章“多途径和不齐整的维度条理”是对于简略和多途径维度技术,响应的,这些技术帮忙人们进行会聚和钻取剖析。
第17章,“维度退化”,展现了怎样用维度退化技术去减少一个数据仓库模式的复杂性。
第18章,“垃圾维”,是对于垃圾维的技术,马上外表上不相干的但是时常会被会员进行请求剖析的数据,用维的方式组织起来。
第19章,“多星型模式”展现了怎样在模式中添加多个星型模式。
第四篇:高级技术
包括六个章节。
第20章,“不齐整数据源”,介绍怎样在数据仓库中处置那些构造没法直接映照到指标表的数据源。
第21章,“无事实的事实表”,帮忙你为客户创立一种可供剖析的辅助数据,一种无事实字段的事实表,该数据没法从数据源直接取得度量。
第22章,“迟来的事实”,包括一个技术,用于处置当数据源中某个特别的事实没有在规划载入工夫以前发生的状况。
第23章,“外部数据源和维度合并“,包含两个主题:处置外部数据源和怎样将多个维中分散的属性合并到一个维的技术。
第24章,“累积度量”,计议两个相干的题目:盘算度量和累积度量的不成相加性。
第25章,“分段维度”,阐述一种技术,可以帮忙运用者针对那些有陆续值的属性进行数据剖析。
附录
附录a,“格局文件数据源”,介绍怎样运用本书例子中的格局文件数据源。
将Mysql这个最流行的开源数据库软件进行数据仓库利用,在本书以前还素来没有被在新建多维数据仓库方面用这种入门指南的方式进行介绍。主题包含 星型模式建模,数据载入(数据的提取、转换和加载:etl),测试测验,以及多维查询。本书由始至终利用一个可实践,相对精简的真实的项目。其全面,易于承受的写作情势使得那些需要创立数据仓库的程序员可以得到相干的示例和材料。
对于作者
Djoni Darmawikarta 曾就职于ibm,此刻是一个加拿大保险企业的数据仓库、商业智能团队中的技术专家。当前生活在Toronto, Ontario
以上就是mysql多维数据仓库指南的细致内容,更多请关注 百分百源码网 其它相干文章!