接传统BI的班

来源 :中国计算机报 | 被引量 : 0次 | 上传用户:kar123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  Forester曾有一份调查报告显示,在拥有传统BI的企业或机构中,大约83%的数据分析需求未能得到满足。甚至,大多数时候,用户还是会用Excel等工具去分析数据。这是一个可怕的现象,它说明了企业或机构投资建设的BI系统只满足了少量需求。
  弥补传统BI的短板
  传统BI系统的经典架构是这样的,底层是数据源,中层是ETL(抽取、转换、装载),上层的数据仓库形成DWD。为了进行数据分析,用户一般会把数据预先汇总,形成DWA(汇总数据层),或者抽取到数据集市,或者抽取到Cube Server打Cube,然后再通过前端展现工具让用户进行数据分析。
  那么,传统BI架构在处理企业数据时存在哪些短板呢?首先,整个系统由诸多个单独产品组成,总体拥有成本比较昂贵。其次,建好一套BI系统通常需要几个月甚至跨年,上线周期太长。第三,完成系统计划之后,实施人员开始从前往后的瀑布式实施,但是,每一步都涉到比较“重”的数据形态转变。这种情况有点类似于我国多年前提出的“计划经济”,不够灵活。
  而对于传统BI面临的这些短板,敏捷BI都能够有针对性地提出解决方案。敏捷BI直接把数据装载到内存数据集市中,内存数据集市存储的是细节数据而不是汇总数据,所以不存在DWA或Cube,然后用户就能直接在前端BI平台上开始数据分析了。另外,基于细节数据,用户就能做探索式分析了。TDWI一旦有数据,用户就可以在数据中做探索式分析,而不是仅仅地利用现有的分析模型,将用户找到答案的成功率从原本的23%提升近50%。
  对比传统BI,敏捷BI的特点在于:整个敏捷BI系统,只需要一个产品,成本一般会低很多;由于数据集市中存储的是细节数据,建模工作比较轻量级,BI系统的上线周期大大缩短;实施过程是自下而上,由业务来驱动。
  敏捷BI快速步入成熟期
  2006年,Gartner公布的BI魔力象限中,标榜为领导者区域的第一象限还看不到一家敏捷BI厂商,全部是大家熟知的传统BI厂商,例如Cognos、Business Objects等。直到2012年,Gartner公布的BI魔力象限第一象限中才见到第一家敏捷BI厂商QlikTech。但是,到了2014年,Gartener的BI魔力象限的第一象限中就已经出现三家敏捷BI厂商了,在数量上占据了近半数的规模。
  在传统BI增长势头依旧非常强劲的今天,敏捷BI的发展速度令业界感到惊讶。这种趋势也说明了,不管从厂商还是从用户的角度来看,敏捷BI都已经步入了成熟期,成为一种主流的BI系统建设方法。
  目前,中国市场上已经涌入了一些敏捷BI厂商,比较活跃的有三家,它们分别是Tableau、QlikView和永洪BI。总体来看,这三家厂商各有优势。首先,在计算方面,Tableau可基于数据库和本地缓存,QlikView可基于数据库和内存计算,永洪BI可基于数据库、内存计算,或者分布式的集群。其次,在支持的操作系统平台方面,Tableau和QlikView都是基于桌面操作系统产品起家的,也正是由于这个历史原因,大量代码集都运营在Windows上,永洪BI可以兼容Windows和Linux两种操作系统。
  综合来看,Tableau在数据可视化方面很突出,QlikView则在内存计算方面是强项,永洪BI在内存计算和分布式计算方面都不错。
  “计划经济”与“市场经济”
  如果说传统BI是一种类似“计划经济”的理念,那么,敏捷BI更像是“市场经济”。
  一方面,企业用类似“计划经济”的那套理念建设BI系统,因为分析组合和分析指标是之前已经确定的,用它们来决定明天的决策,显然缺少实效性;另一方面,经济建设如果一味地开放市场,而不做引导和监管,整个系统又有失控的风险。因此,传统BI与敏捷BI分不清孰优孰劣,它们适用于不同需求的企业而已。
  同时,传统BI存在了几十年,最初建设时,企业可选取的信息技术并不多,硬件水平低,软件系统一般都基于关系型数据库,所以数据科学家想了很多办法来把数据分析推动起来,比如数据层可能有这些步骤:Stage、ODS、DWA、DWD、OLAP等。
  随着硬件水平的大幅提升:内存和CPU的价格逐渐下降、计算能力提升非常大,分布式存储和计算技术都开始走向成熟期。因此,现在要建设一个数据分析系统,企业有很多的办法可以选用。
  那么,传统BI与敏捷BI两者的差异到底在哪里呢?第一,传统BI一般会建立统一视图,这是一个重量级的建模工作;而敏捷BI一般不会试图建立统一视图,而是按主题分类,给每个分析主题分别建一个视图。
  综合看来,两者的做法对于企业来说各有利弊。传统BI建立的统一试图,更有利于用户宏观地把握数据,但是工作量会很大;敏捷BI建立的按主题分类的视图,建立的速度比较快,但是缺乏整体感。
  第二,传统BI一般会分层次处理数据,例如预先把处理好的数据汇总存储到DWA中,或在Cube Server中打Cube。而敏捷BI一直都是基于细节数据,所以最终用户能用的数据依旧是细节数据。从数据分析的角度来说,汇总数据基本已经固化了分析组合和分析指标,而敏捷BI的细节数据将给业务带来更大的灵活性。从理论上来说,分析组合可以随意,分析指标可以随意,最终用户的决定空间较大,可以做探索式分析。
  知名杂志DM Review(数据管理评论)在美国曾做的一份调查报告显示,敏捷BI在部署周期、项目成本、成功率、用户覆盖等方面完胜传统BI。
  那么,用户应该如何看待传统BI和敏捷BI的关系呢?笔者的建议是“守正出奇”。用户应该融合传统BI和敏捷BI的各自优势为我所用。
  一方面,传统BI发展多年,其经验成熟、产品稳定,不能否定更不能抛弃,可将其用于企业决策、洞察、监控整体业务状况,尤其是那些较少变化的宏观指标。
  另一方面,敏捷BI可以提升企业洞察力和决策力,让更多的人拥抱BI。企业需要更快地实现BI,快速而准确地开展商业工作。
  两个角度开启敏捷BI之旅
  传统BI系统一般用于监控相对静态的指标,也提供一些基于模型的数据分析工作,只要运行良好就可以保留。为了提升内部的数据分析工作,提升大家的洞察力,提升企业的决策力,企业可以从部门级和企业级两个角度考虑建设敏捷BI系统。
  对于部门级BI应用。如果部门级数据量不大,直接基于数据库进行分析既对业务没有太大影响,而且性能也足够好,企业则可以直接基于数据库搭建分析系统。当然,有些部门级应用数据量不一定小,有的可能达到TB级甚至PB级。对于这种情况,企业可以把细节数据直接抽取到敏捷BI系统自带的数据集市中,解决性能问题。
  同时,对于部门级应用,由于数据层比较简单,部门人员也不多,因而计算和分析资源分配起来比较简单。不过,敏捷BI也应该提供比较完备的Audit机制,让企业可以知道在数据和计算上有没有错配,如果有的话及时做一些小调整即可。
  对于企业级BI应用,笔者比较认同Forester推崇的一种架构。这种典型的架构被称为“Hub
其他文献
北京恒华伟业科技股份有限公司(简称恒华科技)创立于2000年,注册资本8697.6万元,位于中关村国家自主创新示范区德胜科技园。恒华科技是一家面向智能电网的信息化服务供应商,致力于运用信息技术、物联网技术和理念,为智能电网提供全生命周期的一体化、专业化信息服务。  三个核心技术平台  通过多年的研发,恒华科技业已经形成比较成熟完备的核心技术平台体系,为智能电网的全生命周期管理提供一体化、专业化信息
从去年开始,昆腾在中国试水大数据业务。如今,昆腾的大数据解决方案在中国是否已经开花结果?昆腾公司大中国区总经理张金华兴奋地表示:“除了石油、媒体资产等传统优势行业以外,我们在金融领域实现了新的突破,比如工商银行就将昆腾的StorNext文件平台用于大数据挖掘。”  “在大数据应用中,用户将更关注多节点的并发访问能力。”昆腾公司大数据全球副总裁Janae Lee补充说,“另一个趋势是,现在更强调对数
栏目寄语:  云计算的大门已经打开,但距离真正大规模应用还有距离。为强化云技术,落地云应用,彰显云价值,《中国计算机报》与微软(中国)有限公司联合举办 Windows Server 2012 云创益大赛,以培养更多云人才,打磨更多云实践,见证更多云应用。《中国计算机报》特开设专栏,从战略、应用、技术、技巧等多角度与读者分享云计算的饕餮盛宴。  在北京海淀丹棱街微软亚太研发集团总部一楼的1103会议
近日,“首都网络安全论坛”在京举行。这是“4.29首都网络安全日”系列活动中的一项重要内容,论坛以“网络安全就是国家安全”为主题,以首都重要网络和系统安全需求交流为核心内容,以“需求梳理与对接”为工作方法加强信息安全建设,旨在从个人、企业、产业、法律四个层面全方位整合、发动、利用好各方的社会资源,提升全民网络安全意识,引导行业企业不断创新提高网络安全防护技术能力,展示网络安全最新技术和成果。  近
“今天早上我看到的一组数据显示,从上个季度开始,用手机去看视频的用户已经超过用iPad看的用户数,人们每天平均会看150次手机,移动化用户习惯已经形成,移动应用势不可当。”4月23日,Compuware大中华区总经理琚伟在京接受采访,向记者谈起移动、大数据、云计算和开发运维一体化(DevOps)等趋势给企业IT运维管理带来的改变。  传统运维不再适用  一方面,业务多样化、移动化和云计算让企业IT
2013年末,麦克维尔中标广东移动集采和广东沙溪电信数据中心空调项目,广东移动采用的空调设备包括二级压缩离心式冷水机组WTC系列、串联逆流高效离心式冷水机组WCC系列、变频离心机组WSC-VFD系列,以及高效水冷螺杆机组PFS系列等高效节能的产品。  中国经济的快速发展,加速了信息技术的高速发展,无论是电信服务供应商、金融银行业,还是电子商务运营商,均加大了建设数据中心的投入,以应对信息技术的高速
济宁力争用5年左右的时间把电子信息产业做到千亿元的规模,把济宁打造成山东省乃至全国的“新硅谷”。怎么完成这个目标?  10月25日,由中国电子信息产业发展研究院、山东省济宁市政府联合主办,济宁市经济和信息化委员会、《中国经济和信息化》杂志社承办的“2014中国(济宁)信息产业年会”在山东省济宁市顺利举行。来自工业和信息化部、山东省经济和信息化委员会、济宁市政府、中国电子信息产业发展研究院等部门的领
近期,帝联针对数十万在线教育用户进行了一项调研。结果显示:用户对在线教育网站的不满主要表现在三个方面:无法与老师互动交流、无法答疑;在线课堂气氛不如线下的气氛热烈;网速不给力,影响观看课件的效果。  事实上,不少在线教育网站已经从用户留言中感受到了用户的不满,但对造成用户不满的问题却无从下手解决。帝联副总裁吴轶告诉记者,这些问题往往源自以下几个方面:  首先,互联网运营商网络的互联互通有问题。电信
前不久,IBM和苹果公司在企业级移动市场的战略合作成为业界热议的话题。这一令人瞩目的合作至少验证了以下五件事。  第一,移动应用经过几年的预热,已经从消费市场延伸到企业级市场。IDC预计,企业级移动软件和服务市场的规模到2016年将达到310亿美元。  第二,移动不仅仅是前端应用,而是要与企业级应用相结合,“云 移动”将成为主流趋势。苹果和IBM的合作中最重要的一点是,IBM提供了针对苹果iOS优
在数据中心领域,“融合架构”被提及的频率越来越高。用户不再依据旧观念,关注服务器或存储这样的单个产品,而是站在数据中心整体架构的新高度去审视整个IT架构能够给应用提供什么样的支撑,包括性能、可靠性、安全性等。随着云计算的理念逐渐深入人心,融合架构集成度高、部署简单快速、维护方便、性价比高等优势慢慢显现出来。一体机作为融合架构中最典型的一类解决方案,充分展现了融合架构的种种优势,因此受到了一些行业用