首 页 日 程 演讲人 运营支撑之夜 赞助商 会议地点 住宿信息 参会报名 联系我们 English


    演讲内容

大会主席
 王超
法国电信  
副总裁及中国区首席执行官

 

        大家下午好。因为时间比较晚了,我尽量做到我这一块保持在30分钟里面结束。我来自于BO公司,有一些朋友对BO不是很熟悉,BO全称是Business  Objects,是全球目前最大的做商务智能软件的提供商。BO的历史是90年我们在法国巴黎成立的,95年我们在美国纳斯达克上市,同时我们把总部从法国巴黎搬到了美国。今天来说BO更像一个美国公司,也更像一个全球性公司。
        BO在中国是这样的,我们在2003年的3月份正式进入中国,大家知道那个时候是中国SARS横行的时候,那个时候我们坚决的进入了中国,我们在中国的北京、上海、广州都有办事处。另外我们在中国大中华地区,包括中国大陆、香港、台湾,并且这个总部设立在上海,BO的大中华区总部在上海。在BO来说,我们已经提前实现了祖国统一了。我们在上海还有一个组织是我们的研发中心,是浦东张江,那里我们有200人进行研发,就是研发产品的开发以及具有中国特色的一些特定产品应用开发。我们也希望能够跟电信客户开发一些电信特定的解决方案。
        大家也知道我的PPT上面左下角是BO的LOGO,右下角是SAP的LOGO。在去年下半年,BO市场发生了很大的变化。接下来SAP花60亿美金收购了BO。我们知道一个公司被收购,这个股票上涨是正常的,收购方股票会下跌。从市场情况来看,SAP收购BO,是SAP价格上涨,这证明大家对SAP、BO都很看好。在SAP收购BO的过程中,其中竞争的厂商很多,有IBM这样的公司。最后BO倾向于SAP这样的公司。我们不想被奥克(音)收购,因为这样产品的业务都会完全打散。我们从奥克(音)收购的情况来看,奥克收购海波龙(音),使其一些工具的产品都消亡了。另外我们也不希望被IBM收购,因为对于BO来说IBM太大了。如果IBM收购BO,我们会成为IBM下面的小部门,我们的收入占IBM里面一个小的百分比,等于是巨人里面非常小的、不太重要的职位上。我们跟SAP的合作基本上是一个双赢的过程,因为SAP最擅长是EIM的应用。BO作为BI领域里面最强大的公司,我们这个合作有非常强的业务互补。
        最关键是什么呢?我们为什么愿意跟SAP合并?最关键的是BO整个公司运作是完全独立的。打一个形象的例子,如果把SAP比作为地球,BO公司就是月亮,我们跟SAP的关系,月亮围绕地球运转,但这是完全独立的主体。我们业务的独立运作性可以保证我们整个平台的独立性,同样我们可以一如既往的支持软件客户。这是BO的一些简短的介绍。
        今天我的演讲题目是经营分析系统的基石—企业信息管理。为什么选择这个题目?大家认为传统的BO是一个前端展现的东西,我们在前端展现上面有非常丰富的产品线。这里我举一个很有意思的例子,我们一家重要的电信客户,之前做了一个企业绩效管理的应用系统,里面有非常复杂的体系以及非常多的企业管理报表。它开发这个系统,它只用了一个月的时间。为什么?因为它对整个BI产品很熟悉,它开发只用了一个月的时间,但是统计数据的时候,他发现所有的这些数据经常不准确,而且同级口径对不起来,为了对准这个,我们这个客户花了两个月的时间。你开发系统只用一个月,但是保证这个数据正确,用了两个月时间。所以说整个数据的管理是一个非常重要的话题,这里不仅有技术的问题,也有管理的问题。这就是我们今天挑这个话题讲的原因。
        首先是一个经营分析系统的整体技术架构。右边是我们不同层面的客户。所有这些系统的来源都来自于数据仓库,我们可能叫做ODS或者其他的。这是我们常见的经营分析系统。在这个里面,我们解决的是一个历史数据分析的问题,我们分析的数据通常是到天的,到昨天为止我们整个企业运作的状况。那么有没有可能在这个基础上更进一步呢?其实有相应的解决方案。在BO的解决方案中,我们构建了一个虚拟的解决仓库,我们通过企业信息集成方案,在业务系统里面及时的提取出来。为什么说虚拟?实际上并不存在。通过这样一个虚拟的仓库,我们可以进行实时的业务分析,可以制作一些实时的业务仪表盘。
        接下来我谈一个是什么呢?就是整个企业的信息管理。这里是BO企业信息管理的产品,最底下是我们信息系统的数据源,在这个上面我们有实时处理的数据整合,有ETL的工具,还有一些最佳业务实践,比如说快速的数据提示。另外有做实时数据集成的。这一块我们很多企业已经建立了很多这样的系统。在这个之上还有两个重要的应用,有一个是企业数据质量的控制。再之上我们有原数据管理的软件。这里要强调的是两个,一个是原数据管理很重要,另外一个是数据质量很重要。
        为什么是这样呢?今天我们企业建立很多数据参数系统,我们发现一个很大的问题,从这些不同的方面分析系统出来,数据看起来同级口径不一样。为了解决这个问题,很多系统说采用一种系统的结果,我们把其他的系统停掉了,但是这样做会带来一个问题。假如我有两套系统,我可以相互参照,哪些数据正确,或者中间出现差异的时候,我知道数据出现了问题。当我只有一个系统的时候,我怎么判断这个系统是正确的?当发生问题的时候,我怎么可以及时知道?现在飞机上用控制系统,一个系统出现故障的时候,两个系统可以看出情况。我们BI只建立一个系统,我们就面临一个问题,是如何保证这些数据是准确而且可信的。所以原数据管理很重要,因为原数据管理要看整个ETL里面,看整个公式是不是正确。如果公式是1+1等于2是正确的,如果不小心1+1等于3,对不起,这个结果是有问题的。原数据是帮助你解决这个公式是不是正确的。还有一个是数据质量控制。这是控制整个数据的质量。因为我们知道一个名言“你把垃圾放进去,垃圾出来”。如果你的数据不准确,会影响你的决策系统。如果数据不准确对决策系统正常运行有重要的影响。
        在整个EIM的产品线里面,最前面商务智能是BI市场的领导者,在ETL这里是也是一个专业的工具。在质量这一块,BO有一个质量可以控制的。
        在整个原数据管理这一块,BO产品线有一个好处,BO可以把两块完全打通,这是BO管理的特点。
        接下来我们看原数据管理,原数据管理一个数据仓库或者BI系统的管理涉及很多方面。一个是库里面的数据,一块是数据仓库的建模工具里面的数据,还有一块是ETL建模的工具以及ETL的原数据。一般来讲,BI和ETL的原数据是最大的。业界有另外一个工具是完全独立于ETL或者BI,这是不占任何一方面,既不是数据库,也不是模型,也不是ETL,也不是BI。整个世界潮流的发展情况来看,整个主流的工具都是ETL的工具或者BI的工具,这个可以扩展到其他的领域。独立的原数据工具在美国一些发展比较快的国家是没有办法生存的,在国内采用独立的原数据厂商比较多一些,这样的产品在国际上已经不太流行了。
        为什么呢?其实ETL和BI这些产品发展快,产品更新周期是半年之间发布一个新的产品,原数据变化很大。作为一个厂商你很难跟ETL或者BI的厂商保持良好的关系。
        在原数据里面也包含业务原数据,就是业务上的定义,重视我们的业务语言。还有技术原数据以及运营原数据。
        BO的合并、整合、校验和可信的原数据。我们进行整合,然后接下来做相应的分析。整合的目的把所有的原数据统一起来,这不是简单的放在一起,中间做相应的关联工作,这样来满足所有的完整性。打通所有的原数据之间的关系,这样才可以做相应的分析,做报表、数据的查询等等。
        原数据整合了标准的东西,我们可以做定制化,这个是可以定制化的,这是一些特定的,第三方的,或者客户自己有一些特定的应用,这些原数据加进来很方便,你可以加一个原数据的整合工具。定制化是已经提供的标准,这可以支持一些目前所有的ETL工具,也包括前端工具,比如说水晶报表,还有其他的数据源,有一些Ascential的数据库等,这些都可以整合到里面。有了这个Metadata资料库以后,我们很方便的进行查询。这对你来说,自己定制一个开放的查询界面,同时还提供了输入、输出的功能,也可以提供通过JAVA的调用。这样有一个完整的资料库,我们就可以随时随地的进行访问。输出的时候我们也可以考察很多的方面,比如说整个数据变化的管理,整个运营过程的校验,整个探索的过程等等。我们需要改变数据库的时候,会发现后面有一些受到影响,这就需要看了。
        另外我们还可以做数据的分析,如果我对这个指标的值产生了怀疑,我会看到这个值在什么地方提取出来,中间有怎样的运算过程,然后得到这个值的。我们可以追踪整个运算的过程,然后看数据的处理是怎样的,我们有一个数据源的分析。有了这个原数据管理我们可以很方便的做这方面的工作。
        接下来谈谈数据质量的管理。
        数据质量这一块,BO有一个产品是Firstlogic,这是专门做数据质量的管理。在数据质量这一块,其实非常重要的一点就是说你准确的数据带给我们的业务价值是非常大的,不准确的数据会给我们的业务产生不大的作用,这可以增加整个资产的价值。首先做这个工作第一步要对这个数据进行度量和分析,首先我要了解现状,我现在数据的质量情况是怎样的,我要评估一下这个数据质量。第二步我们要在这个上面做清洗和加强工作,清洗就是把不正确写正确的,加强就是进行填补。第三步我们进行匹配和合并。我很多客户说在不同的系统里面有不同的客户,我们要做的就是把同样的客户识别出来,把所有的记录都合并起来,这是一个匹配、合并的工作。最后我们希望整个过程是一个完善和自动化的过程。因为数据质量控制不是一朝一夕的事情,是每天都会有。因为数据质量就像人的血压一样,在整个过程中,你需要不断连续的监控这个数据,在这个监控的过程中,我们希望数据自动产生告警。
        我们这里有一个更详细的图,在右上角可以看到数据的情况,首先我们要探索一下数据,进行测试一下、分析一下这个数据,同时对数据进行标准化,进行修正。在左下角我们看到这个数据的增强。再后面是数据的匹配,然后再合并。最上面看到的是一个延续的追踪,这是数据质量控制的所有过程。
        首先我们看一下数据质量控制的第一步,就是数据的评估。评估我们要做的事,第一个是数据特质的分析。我们要知道这个数据类型,这个频率是多少?完整性如何?这个数据是不是唯一的?这个唯一性怎么样?对数据进行特征的分析。结构完整分析还有规则协议等等。
        我们举一个简单的例子,数据的清洗,一些客户数据对我们企业来说是非常重要的数据,可以作为一个企业的主数据中非常重要的部分。既然是主数据,有很多的系统,我们要对客户进行清洗、标准化。BO提供了标准化的库,包括超过一百多个国家的信息,姓名、地址等等。我们在中国,跟中国邮政做标准化的地址工作,我们在日本已经实现了整个日本邮政地址标准化的工作,新加坡也实现了,所以对东方语言来说,我们这个工具完全没有问题,只是我们现在跟中国邮政谈一个标准化的地址库。我们看到数据清洗的例子,左边有一些用户进入进来,这些是不完整的,这个整合之后,我们看到输入记录,会反映很多的信息。根据姓名可以判断这个趋向,以及公司的地址,整个公司的地址可以跟邮政编码进行完全的整合,把这个修正过来,整个格式是非常规范的。
        另外针对中国的优化支持。一个是近义词解析,比如说副署和附属。还有地区歧义解析、全半角规范化解析、多音字解析以及数字表达方式解析。在这个例子里面,我们可以看到客户信息地址不一样,但是名字是一样的,这样就可以进行合并。刚才举了一个例子是客户的信息,实际上我们可以清洗数据。各种各样的信息,如果你对这个数量有质量控制的要求,你就可以应用这个进行相应的数据清洗。其中有两个是比较重要的。一个是清洗标准的库,你可以通过一点模式生成这个标准的库。另外一块是以你的业务规则。你要制订一个业务规则,什么是正确的,什么是不正确的,通过业务规则和这个标准的库,就可以匹配和清洗你的业务数据。通常我们在企业里面,这是整个企业的主数据。
        数据增强功能,就是要把数据里面不全的东西进行增补,这在我们邮政通讯录里面有很多电话录、地址做一个增强。我们通过附录的名字、地址、电话号码、EMAIL进行增补。匹配合并把这个作为一个整体来看,我们统一客户数据之后,我们要把客户作为一个统一的整体来看,最后是整个系统我们要做一个连续的监控。这有一个很重要的意义,因为我们BI的项目在运转,数据质量有的时候好,有的时候差一点,你管得紧一点,数据质量好一点。我们需要加强监控,某些时候自动弹出告警信息,让我们进行处理,同时系统上也会有仪表盘的情况。
        这里我举一个案例,这是我们一个客户,他想改善系统的质量。他应用这个,觉得整个产品可以使用户自用。很多数据我们不做分析不知道,做了分析,我们发现通过它的工作,经过9000次的测试,在4300种数据源的73个数据目标中发现了4百万个数据问题。内部财务数据库:减少没有价值的数据75%,帐户数31%。交易数据库中:25000条记录中,发现875条代表了95%的业务。这个里面发现了很多的问题,我们有很多的工作需要做。
        为什么要选择BO的DQ?首先它可信的数据质量管理平台是一个依据。其次是大容量的、高效率的。还有成功的案例、有超越的客户服务声誉、提供成熟的合作伙伴,可以帮助企业成功以及可信的数据质量实施、培训、咨询队伍。
        这里是全球BOBJDQ的客户,有百事可乐、宜家、苹果公司专门数字流行的代表、美国的国土安全部。国土安全部用这个做什么呢?做恐怖分子黑名单的监控,因为我们匹配很多的数据,匹配的时候,我们就可以匹配到美国政府控制的人的名单,我们可以获取相应的数据。
        好的,我们时间到了,我的演讲也完了,谢谢大家。


此文为现场速记 未经整理

2008Billingchina.com© All Rights Reserved.