论文部分内容阅读

一个企业数据集成架构
企业使用商业智能(BI)已经有很多年,它们通过商业智能进行监控、制表、分析以及提升商业运作的绩效。目前,商业智能有三种主要类型——战略性、战术型、操作型。战略型BI用于管理长期的商业计划与目标。而当执行某项商业活动以帮助实现计划的商业绩效的时候,高级管理人员、业务分析员、以及各级经理人员则会使用战术性BI来评估与优化这些活动的绩效。操作型BI则关注于管理与优化每日的业务运行。它将正确的信息在正确的时间发布到正确的业务人员,帮助他们快速响应以解决商业问题与满足新的业务需求。其中,操作型BI是商业智能成长最快、增长最大的领域。
操作型BI可提高报表、分析、与信息发布的速度,从而做出更快的操作型决策并采取行动。对操作型事务或需求做出业务响应的时间通常被称为“行动期”。行动期可以是几秒钟、几分钟或者几个小时,这依赖于业务需求。因此,一般考虑的大多是操作型“适时”(right-time)商业智能,而非操作型实时(real-time)商业智能,因为对给定的业务进程而言需要确定什么才是合适的行动期,而不是尽可能将行动期减少到接近实时。
操作型适时商业智能进程主要分为四类:适时数据集成、操作性商业智能报表、操作型商业智能绩效管理(BI-PM)和决策自动化。
适时(Right-time)数据集成
适时数据集成是企业数据集成架构中的一个组件。该架构包含了数据集成应用、机制、技术与服务,提供联合的一致的企业范围的商业数据视图。该架构中的适时组件收集用于操作型商业智能应用分析的可执行的商业事件。
数据集成有三个主要的集成机制:数据合并,数据联合与数据传播。数据集成可以采用其中一种或多种。
数据合并——数据合并是从多个源系统捕获数据并将这些数据集成到单一的长期的目标数据存储中,如数据仓库。目标数据存储包含高潜伏期的数据,典型的用于战略与战术BI进程。这些数据通过批处理方式的数据集成应用而建立,它以计划好的一定的时间间隔从源系统中提取数据。在数据合并期间,可能会通过数据转换机制对数据进行重新格式化、转换、清洗。随着源系统中的数据出现变化,变化数据捕获机制可能会被使用以使这些更新体现到目标数据存储中。抽取、转换与加载(ETL)就是一种支持数据合并的技术。
数据联合——数据联合对一个或多个源系统提供一个单一的虚拟视图。当商业应用事务向这个虚拟视图提交查询请求时,数据联合引擎从相关的源系统中检索数据,并将它集成到虚拟视图中,进行查询,同时将结果发送到提出请求的商业应用。顾名思义,数据联合总是从源系统中按照需求进行数据的检索。当数据从源数据文件中进行检索时,需要完成必要的数据转化。企业信息集成(EII)是一种支持联合方式进行数据集成的技术。Sybase Avali就是其中一种产品,它提供EII方式的数据联合。
数据传播——数据传播应用将数据从一个系统拷贝到另一个系统。这些应用通常是在线操作,将数据“推送”到目标方,也就是说,它们是时间驱动的。源系统的更新或其他事件可以同步或异步传播到目标系统。同步传播要求源系统与目标系统在同一个物理事务中同时更新。不论使用哪种同步类型,数据传播保证数据向目标方的发送。这种保证是数据传播的一种核心的独特的特征。多数同步数据传播技术支持在数据源与数据目标之间的双向数据交换。企业应用集成(EAI)与企业数据复制(EDR)是支持数据传播的两种技术。EAI驱动的Sybase RepConnect与EDR驱动的Sybase Replication Server(复制服务器)是支持数据传播的两类产品的例子。
数据集成应用所采用的方式依赖于商业与技术需求。应用可能联合使用数据集成机制与技术,也就是说,一个使用混合方式的数据集成解决方案包含几种数据集成机制是相当普遍的。
操作型商业智能报表
许多企业一直在做操作型报表。然而,由于数据源不断增加,企业生成统一及时的操作型报表的困难也一直在增加。数据联合与EII技术可以在此有所作为,为多个分散的数据源提供一个单一的虚拟视图。对操作型商业智能报表应用而言,数据看起来有一个单一的数据存储,但实际上它们仍然存储在原始的源系统中。EII服务器的作用就是访问不同的数据源以满足基于虚拟业务视图的联合查询。
一种常用的解决操作型商业智能报表的源数据质量问题与性能负荷的方法是将详细的BTx数据通过适时数据集成合并到操作型数据存储(ODS)中。使用ODS,在任何时候都可以进行批处理、在线与即席操作型报表,而不会直接影响操作型应用的性能。它也提供一个单一的集成的操作型数据的视图,允许数据被清洗、转换为更易使用和阅读的格式。另一种解决方案是将BTx源数据传播到第二个同样的拷贝。复制拷贝通常是一个实时拷贝,因此除用于操作型商业智能报表之外,也可被用于災难恢复。当然,该方法的问题就是,不能支持源数据的清洗与转换,因此不能处理那些必须通过多个分散的数据存储生成报表的情况。而最终将使用哪种方法将由商业与技术需求来决定。可以肯定的是一个企业的数据集成架构应该支持所有三种方法。
操作型商业智能绩效管理(BI-PM)
除了就商业运行生成报表之外,商业用户也希望监测并分析那些操作以识别操作型事务,防范操作型问题,以及评估每日业务趋势。这些任务由操作型商业智能绩效管理(BI-PM)来支持实现。
BI-PM应用,从简单的商业绩效的图形化显示,到复杂的由方法学驱动的显示实际绩效与计划绩效对比的记分卡都有。多数操作型BI-PM应用努力为各级经理与用户提供易于使用的图形化显示,而不是提供为商业分析员使用的复杂的记分卡。一些操作型图形显示通过对操作型结果与数据仓库的趋势数据进行比较,或者对操作型结果与已经由最佳商业实践所定义的商业规则进行评估,而将度量显示置入到商业环境中去。
除了生成图形显示或记分卡之外,操作型BI-PM进程也可以对用于分析的操作型应用所提交的动态查询进行处理。欺诈监测、风险管理与客户市场营销就是这些需要在在线BTx进程运行期间从分析进程得到快速响应的应用的例子。在多数情况下,分析型进程要求处理大量的数据。分析呼叫数据记录与网络报警等的电信应用就是此种类型的应用。金融与银行也是通常需要在操作型进程中分析大量数据的商业领域。
决策自动化
由操作型BI报表与绩效管理应用生成的报告与度量可能以桌面或移动设备上可交互的图形显示的形式通过电子邮件或打印的报告发布到商业用户。问题是,各级经理与用户常常没有时间或技能去访问、分析这些信息并基于此做出行动。因此决策自动化在此被引入以解决该问题。
决策自动化有多种形式,主要的形式有四种:一是BI警告。BI应用自动比较操作型BI度量与用户定义的商业目标与规则。基于这种比较,应用可能发送一个警告给商业用户,提醒他们可能存在一个潜在的问题或一个需要采取动作的问题。该警告可能通过图形显示、呼叫器、移动设备或电子邮件发送给商业用户,这取决于该问题的紧迫性以及用户当时所使用的接口类型。二是BI引导的分析与程序,提供了对警告的扩展,对提出警告的商业问题提出额外的支持信息。三是BI驱动的建议代理,自动评估警告、商业问题或商业需求,就解决该情形所需的行动给出建议。四是BI驱动的决策代理,评估警告或商业问题并自动采取行动修复这个问题。
操作型BI环境
操作型BI环境主要有三个组件:首先是数据集成服务组件,提供适时数据集成。其次是数据管理服务组件,存储、管理、处理商业信息与操作型智能。第三是分析服务组件,支持操作型BI报表、操作型BI绩效管理与决策自动化。数据集成服务组件必须与IT系统的企业数据集成架构全面紧密的集成,这样,数据集成机制、技术、服务与产品才可以标准化。一个有效的集成基础架构是操作型BI项目成功的一个关键因素。数据管理服务组件支持传统的商业智能方式,数据从源系统流入到操作型数据存储(ODS)或者企业数据仓库(EDW),然后进入一个或多个数据集市以进行更详尽的分析。在操作型BI中,ODS及其下面的数据集市可以达到相当大规模,也可以承担高度复杂的分析。
对一个大规模的阶段性存储、ODS或数据集市中的数据进行处理和分析,是一些新型的BI硬件与软件技术关注的方向。这些技术各式各样,可能包含BI与数据仓库工具、BI加速器、专门的数据库技术等等。不论如何,所有这些技术的目标都是一致的——提高BI进程的性价比。这些提高使对新的操作型BI项目的判断变得有所不同。判断这些技术的价值需要详尽的评估,也可能会进行概念验证的基准测试。Sybase IQ就是这种技术之一。