开发者社区> 问答> 正文

数据资源平台与Dataphin、DataWorks 的定位差异、有何异同?

看到阿里云最近上线了数据资源平台( https://www.aliyun.com/product/drp ),这样阿里云目前已经有三款数据开发和治理类的产品:DataWorks、Dataphin、数据资源平台,看上去都具有数据集成、治理、模型开发、数据资产、数据服务等功能,似乎有一定重叠。

所以想了解一下这三款产品的定位有何差异,功能上有何异同?对于用户来说如何选择?

展开
收起
icycode 2021-01-28 11:14:48 2691 0
2 条回答
写回答
取消 提交回答
  • 大数据开发治理平台DataWorks

    DataWorks 阿里云介绍
    DataWorks与Dataphin区别

    • DataWorks 与 Dataphin 很像,都属于阿里系的数据中台,但二者又存在一定的区别。总的来讲,DataWorks在全栈数据研发能力上相较于Dataphin更强,具备更完善的机器学习能力。Dataphin相较于DataWorks而言具备完善的产品+技术+方法论的数据仓库构建体系,但并不具备很强的全栈数据研发能力,机器学习能力较弱。
    • DataWorks相较于Dataphin更加贴近底层,针对有大数据开发技术背景的人员或公司而言,DataWorks可以提供更加全面和完善的大数据中台服务;反观Dataphin,则是为缺少大数据开发技术背景的人员提供傻瓜式搭建数仓的服务,其使用的概念更加贴近业务场景。因此使用Dataphin可以更快速地搭建数据中台

      数据资源平台

      数据资源平台
      这个东西应该也是属于数据中台的一种,但总体来看与DataWorks和Dataphin没有很大的区别,感觉是一个完善的产品了,二次开发的机会较少,相较于DataWorks和Dataphin使用起来更加简单,只用做数据导入就可以了,但与此同时灵活性大大降低。准确地来讲这直接卖的就是一个平台,如果按照使用程度从底层到顶层的排序是DataWorks->Dataphin->数据资源平台,这三个都属于是数据中台,只不过面向的是不同的客户群体
    2023-07-25 09:43:31
    赞同 展开评论 打赏
  • 区别1:产品功能不同

    1、Dataworks,在阿里集团内部为大家所熟知的部分是D2,在阿里云则是数加平台的主体-数据工厂。DataWorks(数据工场)具备全栈数据研发能力(数据集成与开发、 生产运维调度、离线与实时分析、数据质量治理与资产管理、安全防护、数据共享与服务、机器学习、数据应用搭建)的大数据平台;

    2、Dataphin,通过输出阿里数据中台实战沉淀的大数据建设体系OneData+OneID +OneService(产品+技术+方法论),一站式提供集数据引入、规范定义、数据建模、数据研发、数据萃取的全链路智能数据构建及管理服务。

    一句话总结: DataWorks具备全栈数据研发能力和机器学习开发能力的大数据平台,这是dataworks的优势,劣势就是不具备数据中台(数据仓库)建设方法论的指导; Dataphin具备完善的“OneData+OneID +OneService(产品+技术+方法论)” 数据中台(数据仓库)建设方法论构建体系,这是dataphih的最大优势,劣势就是不具备很强的全栈数据研发能力,暂时也不具备机器学习开发能力。

    区别2:产品定位不同

    1、Dataworks 定位为大数据开发平台,ETL、数据仓库建设等对开发者不做任何限制。开发者可以利用dataworks做任意想做的工作,数据中台(数据仓库)构建的方法论也不做任何限制。开发者可以利用dataworks,既可以按照维度建模理论构建数据中台(数据仓库)、也可以按照范氏建模理论构建数据中台(数据仓库)、也可以按照E/R理论构建数据中台(数据仓库),灵活性是dataworks的优势之一,当然也是劣势之一。因为缺乏数据中台(数据仓库)建设方法论的支持,dataworks对于缺乏数据中台建设方法论经验的开发者(或者企业)不够简单易用;

    2、Dataphin 定位于输出阿里巴巴数据中台方法论,开发者严格按照基于阿里多年零售经验的维度建模理论构建数据中台(数据仓库)。“设计即开发”,这是dataphin坚持的核心理念,使用dataphin的时候,开发者需要严格定义业务板块、数据域、业务过程、维度、原子指标、派生指标,然后“傻瓜式”地构建数据中台(数据仓库)。开发者可能都不用写任何代码(甚至连sql都可能不用写),只要按照上述维度建模方法论完成所有设计,即可构建数据中台(数据仓库)。

    区别3:实时计算能力

    不论是dataworks还是dataphin,均定位于离线批量开发能力。对于实时计算能力的支持,dataworks比dataphin稍微更强一些。利用dataworks集成的datahub+flink等工具能力,能够实现一些简单应用场景的实时计算能力; dataphin也在规划实时计算能力,预计再过几个月,dataphin最新版本也能实现一些简单场景的实时计算能力。

    总结

    1、如果开发者(或者企业)希望傻瓜式的构建数据中台(数据仓库),而且是借鉴阿里基于零售业务积累的“OneData+OneID +OneService”方法论构建维度建模体系的数据中台,那么dataphin是不错的选择;

    2、如果开发者(或者企业)希望购买一套全栈数据研发能力的大数据平台,涵盖完善的数据集成与开发、生产运维调度、离线与实时分析、数据质量治理与资产管理、安全防护、数据共享与服务、机器学习、数据微服务应用搭建等能力。而且数据中台(数据仓库)不限制于维度建体系,那么dataworks是不错的选择。

    2021-02-03 09:38:11
    赞同 展开评论 打赏
问答排行榜
最热
最新

相关电子书

更多
DataWorks数据集成实时同步最佳实践(含内测邀请)-2020飞天大数据平台实战应用第一季 立即下载
DataWorks调度任务迁移最佳实践-2020飞天大数据平台实战应用第一季 立即下载
基于DataWorks数据服务构建疫情大屏-2020飞天大数据平台实战应用第一季 立即下载