您的位置:焦点中国网>新闻>国内>正文

走进Intelligent Data Fabric——找到数据价值中的“那颗星”

2021/9/28 13:28:31 来源:焦点中国网

1944年,电子管计算机MARK-1和MARK-2制成;1964年,划时代的System/360大型机面世;1981年,世界上第一台个人电脑发布;2011年,Watson在《Jeopardy!》节目中击败人类冠军,刷新了人们对于AI能力边界的认知……这一系列的技术创新背后,始终有一位“蓝色巨人”的身影。如今,这家企业正计划在2023年推出1000个量子比特的量子计算机,引领产业迈入全新的量子时代。这就是IBM。

在110年的历史长河中,科技产业经历了翻天覆地的变化,有不少商业巨擘销声匿迹,也涌现出了无数的行业先行者。而在快速更迭的科技浪潮之下,IBM一直在通过不断的创新和转型持续保持竞争力,其底气来自于该公司的3000多位科学家、10万多位研发者,甚至还培养出了6名诺贝尔奖得主和6名图灵奖得主。2020年,IBM的科学家和研究人员共获得了9130项专利,数量位列所有企业之首。当然,IBM之所以能够在每一次科技变革的十字路口都能找到正确的方向,更重要的是在于果断的决策和笃定的执行。

“从IBM的技术发展途径和策略上来讲,主轴一直是稳定的、统一的。”IBM大中华区科技事业部客户成功管理部总经理朱辉谈到,“我们认为,IBM现在已经是全球领先的混合云与AI技术的供应商,也秉承着一贯以来的理念,正在成为客户在数字化转型进程中值得信赖的合作伙伴。”IBM的这种转变是由上及下、由内而外的。市场销售层面,IBM形成了以数字化转型、混合云与AI能力为主轴的咨询服务体系,通过Technology Garage、Design Thinking Workshop等方式与客户共同创新,帮助客户运用最新的技术在产生新的业务价值的过程中,去发现、定义新的业务场景和MVP(最小可行性产品)。产品研发层面,将软件产品线基于客户使用场景集成打包,通过Cloud Paks以容器化的方式在任意平台上以微服务的方式进行交付。

(IBM大中华区科技事业部 客户成功管理部 总经理 朱辉)

上述变化已完全融入到IBM日常的市场进入(Go to Market)策略中。在过去的12个月,IBM的云业务营收达到270亿美元,超过总收入的三分之一,全球有3200多个企业级客户在使用IBM的混合云平台,有4万用户在使用IBM的企业级AI技术。与此同时,这些企业也在思考如何在混合IT环境中取得更大的突破,例如:快速、简单、低风险、低成本的搭建混合云环境的基础架构;实现智能自动化,专注于高价值工作,提高生产力;利用AI使得数据价值最大化。根据IDC在2020年初的一份调查报告,有90%的企业数据或无从访问、或无法信任、或未被分析利用,导致企业在决策时受到较大的阻碍。面对着这些新诉求,IBM提供了一个AI赋能的数据架构——Intelligent Data Fabric。

 

构建数据神经网络

从20年前的数据仓库到10年前的大数据和数据湖,企业业务的演化促使着数据架构随之改变。起初,企业会将各个业务系统的数据抽取出来以中心化的方式放到数仓,并不需要复杂的数据架构和数据模型,原因是早期的数据量偏少。随着非结构化数据的涌入,大数据处理成为常态,企业对数据价值的重视程度与日俱增,开始寻找新的工具进行深度挖掘和元数据管理。由此,数据架构逐渐走向分布式和跨平台。不过,这又引发了新的问题:数据迁移的成本如何解决?研究人员怎样快速高效地找到正确的数据?数据安全又如何得到保障?

Data Fabric给出了答案。“简单地说,就是在正确的时间,从任意位置,将正确的数据与正确的人连接起来,从而全面释放数据价值,加速企业的数字化转型。”朱辉解释称。进一步说,Data Fabric是以智能、安全和自服务的方式,动态地协调分布式的数据源,跨数据平台提供可信赖的数据,从而支持各种分析及应用场景。在工作方式上,Data Fabric并不是简单的点对点连接,而是像人脑一样构建了一个虚拟的“神经元网络”。

对于那些担忧数据共享效率和可靠性的人而言,无论是从事技术岗位还是业务岗位,都能从Data Fabric中找到新的价值,从而将更多的精力放在数据分析上,避免由于数据访问限制而造成的数据分析偏差,数据的质量和处理过程也得到了大幅优化。这种转变离不开企业的自动化能力提升,一项针对企业AI采用情况的调研显示,疫情期间,将AI融入业务流程已成当务之急。在受访的IT专业人士中,有43%表示其公司加快了AI进程。在全球受访的IT专业人士中,近半数表示他们在评估AI供应商时,很大一部分是衡量供应商对流程进行自动化的能力。

IBM Intelligent Data Fabric的自动化能力体现在四个方面:AutoSQL,无需移动数据,即可大规模实现自动化分布式查询,降低了人们对数据来源的掌握门槛;AutoCatalog,可以根据发现数据和分类的流程实现自动化,分类后建立自动化目录,维护来自不同数据环境数据资产的动态的实时目录,为跨企业内不同业务团队之间的数据实现轻松查找;AutoAI,实现模型训练优化的自动化,提高了准确性和可解释性;AutoPrivacy,实现企业内部敏感数据识别、监控,以及后续政策实施的自动化。

 

数据经纬的最佳载体

基于开放的混合云平台OpenShift,IBM将Intelligent Data Fabric融入到Cloud Pak for Data中,以容器化产品的方式快速向客户交付。可以说,承载了IBM企业级AI能力的Cloud Paks,是IBM混合云与AI战略的一个重要支点。在Cloud Pak for Data 4.0版本中,整合了AutoSQL、AutoCatalog、AutoPrivacy、AutoAI能力,以及WKC、Watson Knowledge Catalog等数仓、数据治理和机器学习能力。通过在实验室环境中与Snowflake的比较,Data Fabric能够把查询的速度提高8倍以上,成本降低一半。

不过,Data Fabric并不是IBM独有的概念,诸如NetApp、informatica、Talend等IT企业均推出了针对Data Fabric的解决方案,那为什么说IBM Cloud Pak for Data应该是当前业界应对Data Fabric功能最完善的数据平台之一呢?首先,其对于Data Fabric需要具备的四种能力有着较好的支持,包括数据之间的虚拟连接、企业数据目录、自动化数据平台、自动化安全策略,这也使得上述四大自动化能力之间有着更好的“化学反应”。

其次,IBM数十年来的技术积累给了Cloud Pak for Data更多的底气,例如容器化的DB2云数仓、数据虚拟化技术的沉淀,以及结合了机器学习、知识图谱等能力的Watson Knowledge Catalog等等,交付客户上线之初就能确保在数据共享的过程中能符合类似GDPR的数据隐私保护要求。同时,IBM作为一家老牌的专业数据集成的供应商,数据复制和数据集成的自服务能力也在日趋完善。

许伟杰是IBM中国混合云与AI华东及华南大区的总经理,加入IBM已有15年的时间。作为一线的业务人员,他深知企业需求的变化和客户对IBM产品的反馈。“前段时间,我和上海某家著名的医疗大数据公司交流。面临的一个问题是,医院一方面不愿意把数据开放给某个大数据平台,但另一方面,医院又想分析数据,而单个医院的数据量又不够。如果采用了Data Fabric架构,加上IBM的区块链技术,使用类似联邦学习的概念,是不是就能让数据的读写、分析,以及拥有的权限相互独立?这样就把问题解决了。”许伟杰说。

(IBM中国 混合云与AI 华东及华南大区 总经理 许伟杰)

 

12星座中的黑科技

几乎每过五年,许伟杰销售的产品中就会有70%-80%发生变化,这种现象既代表着IBM在不断推出新的技术和产品(很多黑科技产品的销量甚至是前两年的3-4倍),也说明了中国客户的需求和认知能力在快速变化和提升。算法求解器Cplex和Planning Analytics是IBM Cloud Pak for Data包含的两项能力,其中,Cplex在生产环境中计算最优解时有着更好速度和质量表现,在疫情期间帮助不少制造型企业实现了降本增效,例如在一些车企中支持多产线小时级的自动排产、在产销协同系统中做APS模块优化等,实现了单人跟进项目数量十倍的提升。

Planning Analytics是一款AI赋能的绩效管理,主要用于全面预算、投资模拟、测算等领域,底层基于多维cube内存数据库,为企业提供了更强的预测能力,例如帮助芯片制造企业预估三年后给下游厂商的报价,以及与合作伙伴联手帮助房地产公司实现集中供地,在两分钟内算出200套方案,让经营者了解到如果某小区原材料晚进一天,具体到每个房间的成本变化。类似的产品还有很多,像Aspera可以让异国的客户在同等线路和带宽的情况下,数据传输速度提升10-20倍,这种技术还可能用于新能源的OTA升级等更多的场景。

许伟杰希望在IBM的众多黑科技中,挑选出更具创新性且能快速在业务场景落地的产品,并将这一项目命名为“12星座”计划,这些产品与中国客户的需求紧密结合,包括超算调度软件LSF、算法求解器Cplex、集成规划解决方案PA、建模与分析工具SPSS、AI赋能应用资源管理平台Turbonomic、可观测性APM平台Instana等等。值得一提的是,今年上半年Cplex、PA在中国交付的营收已经是去年的三倍。随着越来越多的标杆案例成功落地,将有更多的行业客户借助混合云与AI技术,解锁业务转型过程中的数据价值。

“如果了解IBM的产品就会知道,12星座的产品,在我1月份接手的时候都不是主力产品。但是我有一个梦想,就是可以从我们的宝库里面200多个产品中,挑出12个真正能帮助中国企业带来价值的产品。之后,我希望把这部分的营收做到比传统主力产品的营收还要多,这是我一两年之内的愿景。”对此,许伟杰有着十足的信心。

 

结束语

未来5年,IBM希望专注做好一件事:那就是利用IBM的平台、软件、硬件、服务和生态的全方位能力,成为企业数字化转型的最佳技术伙伴。Data Fabric的出现,正是为了帮助企业在茫茫的数据浪潮之中,找到最具价值的“那颗星”。而就像朱辉所说的,这条围绕数据价值的技术创新之路将会一直走下去,利用混合云和AI技术,让数据更公开、更民主、更安全,更能被普适的使用,让更多的人和企业充分享受到数据的价值。(作者:中关村在线  徐鹏)