`
thecloud
  • 浏览: 882132 次
文章分类
社区版块
存档分类
最新评论

BI 通用流程

 
阅读更多

先看图:

aspnetx

此图是根据个人经验总结出的一个BI通用流 程,适用于报表方案,多维分析方案,但不适用于数据挖掘的方案。

BI项目关键资源:业务专家,BI开发人员,业务开发人员。

业 务专家的参与有助于提高需求的准确性,BI开发人员主要负责BI过程相关资源的组织和管理,业务开发人员配合BI开发人员确认数据及业务的相关工作。

下 面对这个开发流程做一个解释:

首先,从报表下手可以很容易的掌握用户所关注的东西,结合业务系统以及数据结构可以有助于对主题有个大体的 印象,同事对一些用户比较关注的维度和度量才能有个概念。

但是理解业务是个需要经验和理解能力的过程,不同行业都会有不同的特点,所以这 里需求人员和业务专家的参与就比较重要。另外同样也不可忽视掉包括项目相关的文档的重要性。

前四个步骤要求一定是有BI经验人参与的。这 样看过报表以及系统后,对主题,度量维度等才能有个大体的规划。试想如果连主题,度量维度都不清楚为何物,那么此处根本无法进行,包括后续的维度建模。

闲 话:相对国内的BI来说,报表是很容易获得的,因为大多数项目都是上BI之前,先把用户手头上的报表给解决了------即使你不想要用户也会塞给你,是 啊,一大堆报表看上去挺头疼的,管它呢,还是看看能发觉出什么先吧。

模型验证,根据已建立的维度模型验证是否能满足所有的报表需求。同 上,此步骤必须要有BI经验的人做。如果模型满足不了统计的要求则重新建模。这里是需要一个反复迭代的过程,每次迭代的结果都要沉淀下来并且形成文档。

反 向确认数据仓库结构,手动或者系统自动均可,自动生成来说SQLServer从2005就已经支持了,不过为了命名规范,还是手动来生成数据仓库比较有必 要。

分析数据来源及SSIS开发。最好是由相关模块的开发人员参与,因为开发人员是对数据结构比较了解的,并且有SQL功底,而且还掌握 业务。这一步的目的是填充数据仓库。可能需要适当SSIS培训。不过,这一步公认是最耗时的。同时,不是所有的统计项就是能从业务那边解释的了的,比如某 些统计概念,可能在业务系统从来就没出现过,但是通过基本数据组合都可以计算出来。所以类似概念,确认计算公式等就需要BI人员承担起需求的工作去确认。

同时,BI人员需要与业务开发人员协同制作开发数据增量的方案,以配合SSIS的开发。还有一种比较好的方法就是开发人员写SQL然后 BI人员用BI的方法将其整合到方案中,总之方法很灵活,关键的就是跟开发人员的沟通。

SSAS开发,生成多维数据集,确认分区,增量等 操作,建议这里一定要符合SSAS的规范,命名约定等,这样会给后续工作减少很多麻烦。

SSRS等其它开发。这一步需要参与的人员可以灵 活来定,因为是需要一定的MDX经验,而且有可能需要对团队进行报表开发培训。需要指出的一点是,即使到目前的SQLServer版本,用Cube作为 SSRS的数据源开发报表还不是很舒服,相关问题有时间会详细阐述,同时也希望有些问题能在下一个版本的SQLServer中解决。

数据 验证,等同于测试的过程,观察统计出的数据是否有异常,比如通过单个SQL查询的方式对报表数据进行验证。如果出险问题,根据问题的实际情况再去确认是哪 个环节出的问题。

最后生产环境的部署,没什么好说的了,注意管理好SSRS的报表资源就OK了,比如为了避免相互覆盖,我们可以要求报表 开发人员不使用共享数据源等。

此方案还可扩展为SSAS支持的多维分析项目,相信之前通过对报表等的分析各大主题已经成型了,所以完全可 以直接把Cube拿过来用。相信多维分析的方式会吸引住客户的眼球。前台分析工具很多,再次不一一做介绍。

至于是否可以继续在此基础上扩 展数据挖掘的经验,aspnetx认为,这里会有资源可以继承,但是能否满足数据挖掘的需求不好说,所以还得根据具体需要解决的问题来出发。

此 外,aspnetx总结的BI项目中四大“最”:

最关键的部分:维度建模,这里准确与否将决定整个项目的成败,这里也最需要经验。

最 有难度的部分:主题确认。对于业务复杂的系统来说,这是一个需要时间的过程,而且需要反复迭代。

最累人的部分:SSIS开发。SQL脚本 工作比较多,很累人,而且也需要耐心。

最需要的支持:客户最高领导,记住一定要是说话好使的,遇到问题能当机立断的,否则会死得很惨。

这 个方案可能在不同人想法里不太一样,最常见的是认为应该先对报表进行分析,完后再针对报表内容直接分析数据来源,然后根据数据来源结果决定如何建模。个人 不建议这样的方法,这样的分析工作会变得很繁琐而且重复劳动多,当然可以先对需要统计的东西汇总然后再一项一项的分析,但是你不认为按照维度建模的方式去 分析是一个更好的汇总吗。

总之,仁者见仁,智者见智。还请各位高人提出更好的实施意见。

最后,本人aspnetx四月也 将融入到北漂一族,借此机会在这里希望自己能在北京认识更多的朋友。

分享到:
评论

相关推荐

    安卓逆向学习笔记之ART下dex加载流程和通用脱壳点.docx

    安卓逆向学习笔记之ART下dex加载流程和通用脱壳点.docx

    安卓逆向学习笔记之Dalvik下dex加载流程和通用脱壳点.docx

    安卓逆向学习笔记之Dalvik下dex加载流程和通用脱壳点.docx

    数据可视化,大屏,移动报表,数据中台,WEB应用的微代码NoBI(No Only BI)开发平台

    数据可视化,大屏,移动报表,数据中台,WEB应用的微代码NoBI(No Only BI)开发平台。简单, 敏捷, 高效, 通用化, 高度可定制化, 让你的项目瞬间档次提升。完全真正打通前后端, 支持图形数据联动,筛选,钻取, 支持几乎常见...

    adfbinaryloader:adf示例项目,演示如何在prem文件夹位置获取通用文件并将其加载到Azure存储中

    今天,我们将在Azure中创建一个通用文件加载器,该文件加载器将复制到本地的文件共享中的所有内容加载到Azure存储Blob中。处理流程如下所示: 先决条件: Windows服务器(本地或Azure)具有文件共享,该文件共享...

    业务绩效管理平台概述第2部分:Hyperion / Oracle平台-研究论文

    跨通用基础的运营管理流程,使组织能够变得智能,敏捷,统一并能够更好地优化企业范围内的绩效,从而帮助组织从现有的Oracle投资中获得更大的价值,并在集成Hyperion市场领先绩效方面迈出了重要的里程碑使用Oracle...

    快速开发平台+OA+HR+CRM源代码 v8

    采用aspx.net框架技术,c#语言,系统采用的方法及对象全部是自主研发的,在所有vs开发环境中都可以通用,采用sql2005数据库。使用者不需要懂技术,不用写代码,实现零代码开发,利用它就可以快速地开发出强大的管理...

    Oracle Hyperion ESSBASE中文资料

    Hyperion的组件包括市场领先的OLAP引擎Hyperion Essbase以及相关的支持服务,例如应用程序集成、查询与报告工具、通用安全性及用于管理和传递整个企业信息的个性化 Web 界面。此平台基于业界标准,并充分利用 Web ...

    北京中科信软oracle培训课件

    数据仓库和商业决策的关系 描述当今商业领域BI和数据仓库的角色 描述为什么在线联机系统(OLTP)不能满足决策支持 决策支持系统的数据抽取流程所带来的数据仓库技术 使用数据仓库技术的原因 如何使用数据仓库来...

    北京中科信软数据仓库培训

    第一天上午 数据仓库和商业决策的关系 描述当今商业领域BI和数据仓库的角色 描述为什么在线联机系统(OLTP)不能满足决策支持 决策支持系统的数据抽取流程所带来的数据仓库技术 使用数据仓库技术的原因 如何使用...

    My-Awesome-Stars-Repositores:我的明星存储库

    Nalu:一种通用的非结构化大规模并行低马赫流程代码,旨在支持基于Sierra Toolkit和Trilinos求解器Tpetra / Epetra堆栈的感兴趣的能源应用。 已为代码库选择了开源BSD第3条许可模型。 有关更多信息,请参见许可。 ...

    XX系统方案设计.doc

    4 采用SQLServer2000/2005作为信息系统数据库 SQL Server 2005 是一个全面的数据库平台,使用集成的商业智能 (BI) 工具提供了企业级的数据管理。SQL Server 2005 数据库引擎为关系型数据和结构化数据提供了更安全...

    Windows应用程序捆绑核心编程光盘代码

    4.2.2 命名管道服务端与客户端之间通信的实现流程 80 4.2.3 命名管道服务端与客户端之间通信的实例 81 4.3 如何用邮槽进行进程间通信 85 4.3.1 用邮槽进行进程间通信的步骤 85 4.3.2 邮槽服务器端与客户端之间...

    传统分析与大数据分析的对比.docx

    大多数数据仓库都有一个精致的提取、转换和加载(ETL)的流程和数据库限制,这意味着加载进数据仓库的数据是容易理解的,洗清过的,并符合业务的元数据。 大数据最大的优点是针对传统手段捕捉到的数据之外的非结构化...

    asp.net知识库

    2分法-通用存储过程分页(top max模式)版本(性能相对之前的not in版本极大提高) 分页存储过程:排序反转分页法 优化后的通用分页存储过程 sql语句 一些Select检索高级用法 SQL server 2005中新增的排序函数及应用 ...

Global site tag (gtag.js) - Google Analytics