大数据的开发能力已经成为企业的核心竞争力之一, 企业对数据资产的管理、加工、利用的诉求也越来越强烈。
9月5日,阿里云发布了DataWorks V2版本, 可提升数据开发的效率并简化数据操作,为企业提供了安全可靠的一站式大数据智能云研发平台。
众所周知,企业在构建自有大数据体系开展研发工作时,通常面临着诸多难题,例如技术栈臃肿导致上手门槛高、系统维护成本高等问题,且数据质量难以保证。此次发布的阿里云DataWorks V2版是全球唯一支持在web页面上即可完成数据研发全流程的大数据开发平台,可以有效帮助企业规避上述问题。
据介绍,阿里巴巴集团拥有完善的大数据计算基础能力,如离线计算引擎MaxCompute、流计算引擎Flink以及机器学习PAI平台。而DataWorks则是对上述基础能力整体进行了封装,并承担了大数据相关的技术流程与管理方法论,以可视化的方式提供服务。得益于阿里巴巴多年的经验沉淀,该产品在部署模式、数据集成、数据安全等方面都实现了与企业级需求的高度契合。
阿里云Dataworks负责人升龙表示,“如果说阿里的超大规模大数据存储和计算引擎是一台个人电脑的主机,那么DataWorks就是这台电脑的操作系统,帮助企业用可视化方式或几百行代码就能构建独属于自己的数据智能产品。”
具体来说,该产品提供了任务调度、元数据管理、权限管理、智能运维等能力,可轻松实现结构化、半结构化、无结构化海量数据的集成、加工、挖据,同时也兼具智能运维、数据质控、数据安全的必要能力。用户通过托拉拽的方式即可快速构建数据处理流程,使用智能SQL编辑器编写代码。
此外,在数据研发平台基础上,该产品还提供了整套的数据治理能力,帮助用户以更低的成本构建可靠易用的数据仓库。
目前,DataWorks+MaxCompute的组合已经服务了新零售、金融、新能源等领域的龙头企业,以东润环能为例,使用该组合后其整体数据处理时间不到自建方式的1/3,同时确保了云上新能源电力数据的安全。
值得注意的是,在Forrester发布的CDW(云数据仓库) Q1 2018报告中,DataWorks+MaxCompute位列世界第二,是唯一入选的中国产品。