电信数据仓库项目实施方法论探讨

来源:项目管理师    发布时间:2012-05-06    项目管理师视频    评论

数据粒度和数据组织
在数据仓库的每个主题,都必须知道这个主题所限定的维的层次、事实数据的粒度;事实数据存储的期限,“过期”的数据的处理方法。

维和度量的唯一性和公用性
在不同的主题中对于同一个维度应该只有同一表示,尤其对于业务代码类型的维度,如果一个业务代码形成了多个维表,那么在元数据维护过程中将困难重重。在整个系统范围内,要不断检视维定义是否唯一,如果有可能,一个维表要尽量被多个主题引用。

数据粒度变粗的原因
在数据仓库中,出于数据组织的规则、业务的要求、性能的要求,都可能对一个主题的事实数据进行汇总,形成粒度较粗的事实数据。实际上,粒度变粗的事实数据为最终的用户提供了更宏观的数据视图,这种宏观的数据视图当然需要进行跨主题的数据融合才能更加具有应用的价值。

归并不影响数据间联系
在数据仓库中,不同主题的数据之间的物理约束或许不再存在,但无论这些数据如何变化,要知道必须有一些“键”在逻辑上保持着不同数据之间的联系,这样就可以保证有联系的主题数据之间可以进行汇总以支持未知的应用,否则数据仓库的数据不可能灵活支持各种应用的。(见图4) 为了让现有数据资源获得有效利用,后台的数据仓库模型和前端分析应用模型紧密结合,不能孤立的分别设计和实施,数据仓库模型最终必须服务于前端分析模型,要求服务提供商具有较强的电信行业前端分析应用模型的经验。

项目的启动
数据仓库按“长期规划、分步实施”的思路按项目进行实施。项目启动前需要制定项目的目标,制定项目计划。项目包括业务范围、数据准备、技术设备,资源、技能、组员培训、责任、方式方法、工程跟踪及详细工程调度。

需求的调研与分析
业务范围划定后还需要具体征求业务部门的分析需求,需要调研生产系统的现状,数据质量情况,分析需求的优先级和是否可实现,并组织相关部门做需求的评审。

确定主题进行仓库结构设计
数据仓库是面向决策支持的,它具有数据量大但更新不频繁等特点,只有对数据仓库进行精心设计,才能满足数据量快速增加而查询性能并不下降的要求。基于用户的需求,着眼于某个主题,开发数据仓库中数据的物理存储结构。进行数据仓库的概念设计、逻辑设计和物理设计。 确定技术方案:根据业务需求和技术架构的要求,选择合适的数据仓库引擎、展现工具等软件及硬件平台。 数据抽取与精炼及分布:根据数据仓库的设计,实现从源数据抽取数据、清理数据、综合数据和装载数据。 实现分析结果的展现:对数据仓库的使用者按其职责做应用和数据访问范围的定义,使用户通过企业门户实现对数据仓库的访问。 数据仓库的管理:实现对数据仓库元数据的管理和数据质量的管控;实现数据仓库的安全运行。

总结
电信数据仓库应按“长远规划、分步实施”的思路,首先满足企业迫切的经营分析和财务分析主题应用,按照自下向上的方法首先建立数据集市,通过数据集市促进数据仓库的建设。

上一页12下一页

视频学习

我考网版权与免责声明

① 凡本网注明稿件来源为"原创"的所有文字、图片和音视频稿件,版权均属本网所有。任何媒体、网站或个人转载、链接转贴或以其他方式复制发表时必须注明"稿件来源:我考网",违者本网将依法追究责任;

② 本网部分稿件来源于网络,任何单位或个人认为我考网发布的内容可能涉嫌侵犯其合法权益,应该及时向我考网书面反馈,并提供身份证明、权属证明及详细侵权情况证明,我考网在收到上述法律文件后,将会尽快移除被控侵权内容。

最近更新

社区交流

考试问答