开发者社区> 问答> 正文

数据中台跟传统的数据仓库有什么区别?

数据中台跟传统的数据仓库有什么区别?

展开
收起
侠盗你 2018-11-09 09:40:05 16425 0
8 条回答
写回答
取消 提交回答
  • 数据中台和数据仓库的区别核心在于理念的不同,数据仓库更多的是站在IT技术的角度,而数据中台是站在DT的交付,更多是服务于业务的视角,一开始就强调业务引领。

    2020-03-18 00:29:28
    赞同 展开评论 打赏
  • 数据中台从某个意义来说属于数据仓库的一种,都是要把数据抽进来建立一个数据仓库。但是两者的数据来源和建立数仓的目标以及数据应用的方向都存在很大差异。

    首先,从数据来源来说,数据中台的数据来源期望是全域数据包括业务数据库,日志数据,埋点数据,爬虫数据,外部数据等。 数据的来源可以是结构化数据或者非结构化的数据。而传统数仓的数据来源主要是业务数据库,数据格式也是以结构化数据为主。

    其次,建立数据中台的目标是为了融合整个企业的全部数据,打通数据之间的隔阂,消除数据标准和口径不一致的问题。数据中台通常会对来自多方面的的基础数据进行清洗,按照主题域概念建立多个以事物为主的主题域比如用户主题域,商品主题域,渠道主题域,门店主题域等等。数据中台遵循三个one的概念: One Data, One ID, One Service,就是说数据中台不仅仅是汇聚企业各种数据,而且让这些数据遵循相同的标准和口径,对事物的标识能统一或者相互关联,并且提供统一的数据服务接口。就像做菜一样,按照标准化的菜名,先把所有可能用到的材料都准备好。而传统的数仓主要用来做BI的报表,目的性很单一,只抽取和清洗该相关分析报表用到基础数据,新增一张报表,就要从底层到上层再做一次。

    然后,在数据应用方面,建立在数据中台上的数据应用不仅仅只是面向于BI报表,更多面向营销推荐,用户画像,AI决策分析,风险评估等。而且这些应用的特点是比较轻,容易快速开发出来,因为重要的数据分析工作在数据中台已经完成并且沉淀,之前工作成果都能被多个应用共享。 而传统的数据仓库主要是面向报表,数据应用的建设就是传统烟囱式建设,每次都从头再来的开发方式。

    最后,数据中台是建立在分布式计算平台和存储平台,理论上可以无限扩充平台的计算和存储能力。而多数的传统数仓工具都是建立的单机的基础上,一旦数据量变大,会受单机容量的限制。

    2020-01-19 09:41:39
    赞同 展开评论 打赏
  • 1、数据打包API 2、数据标准化,技术规范化,解决重复造轮子 3、数据仓没有啥贴合实际的应用项目,导致没有更进一步。但是数据中台可是从内外业务下手,不断优化。只是相对数据仓更友好和接地气。 4、数据中台是阿里提出的,酷炫叼炸天的宣传,迷糊迷糊大家,自己当领头羊。

    我看前面几个答案都是吹嘘,这些人很恶心,张口闭口数据中台好处,却不提数据仓。

    2019-12-27 09:28:14
    赞同 展开评论 打赏
  • 数据中台和前两年提数的“数据湖”有什么不同?都是可以做实时数据加工,存储非关系型数据。至于说的数据中台中的各种服务,在数据湖中也可以实现,是不是这两种名称都是一个东西。为啥有了数据湖的概念又整个数据中台出来。费解~

    2019-10-30 17:14:56
    赞同 1 展开评论 打赏
  • 数据中台与数据仓库的差别不应该是实时或者非实时。而是数据中心、数据仓库、数据集市更多地是面向不同对象的数据资产形态变化。而数据中台更多强调的是服务于前台,实现逻辑、标签、算法、模型的复用沉淀。

    2019-07-17 23:13:09
    赞同 展开评论 打赏
  • java 数据分析 数据可视化 大数据

    数据中台,解决数据“存”、“通”、“用”难题

    让一切业务数据化,一切数据业务化

    具体而说,数据中台并不是一个跨时代的全新理念,就好比笔者当年学习SOA一样,发现其实质还是组件化,模块化,是设计模式与业务端的应用。数据中台建设的基础还是数据仓库和数据中心,并且在数仓模型的设计上也是一脉传承,之所以我们现在处处推崇数据中台建设及应用,一个是因为数据中台确实有过人之处,另一个是这套模型在阿里体现了巨大的应用价值。

    首先先总结一下数据中台策略中的几个过人之处。

    第一:数据汇聚,承上启下。

    数据中台策略的基本理念是,将所有的数据汇聚到数据中台,以后的每个数据应用(无论是指标和分析类的,还是画像类和大数据类的)统统从数据中台获取数据,如果数据中台没有,那么数据中台就负责把数据找来,如果数据中台找不来,就说明当前真没有这个数据,数据应用也就无从展开。按照这种模式,如果企业中数据应用数量大于3-5个,那么数据中台将整体上节约30%的成本,随着数据应用的增长,这样节约的成本还会更大。传统的数据仓库和数据中心,如果做得比较好,设计到位的话,也会做完整的数据模型设计,但是往往偏重于设计和技术,在执行的过程中,很难保障数据的全,也很难保证数据应用不跨过数据中心,重新做数据的话,那么后期数据则会比较混乱。相对而言,数据中台策略中更加强调数据的“全”以及数据中台组织与数据应用组织之间的协作关系,从设计、组织、建设、流程角度保障了模式的落地。

    袋鼠云数据中台策略

    第二:纵观大局,推动全局

    数据业务在企业中应当是一个完整业务,是一个亟需提高定位的业务,是企业的战略业务。所以数据中台策略应当对应企业的数据战略,并提供更有力的支撑,而不是仅仅停留在把数据找到,把数据清洗,把数据算出来。所以,构建数据中台建设,需要详实了解企业的数据情况,数据需求以及构建数据业务的推动蓝图。上述内容应当通过相互衔接的七个数据服务进行完整的构建以及推动

    袋鼠云数据中台七大数据服务

    数据资源规划及获取

    盘点数据资源、规划数据资源、获取数据资源,并将所有数据资源进行完整呈现;

    数据质量分析及提升

    从基础数据、业务数据、大数据视角综合分析当前的数据质量问题;

    基于中台策略的数据整体建模与数据资产管理

    企业可根据数据资源规划报告指导后续数据治理和数据资产管理平台的建设,最终服务于企业数据应用场景。

    实体画像及标签引擎

    对用户、产品、客商、营销各主题域进行标签提取,将其特征数字化,为后续进行精准 营销和用户画像提供必要条件。

    数据指标体系梳理及计算(BI)

    构建企业标签体系,着重分析当前需要但是无法获取到的指标,描述使用不便的指标,分析问题原因,绘制数据供应链条;

    数据应用规划及实现(DI)

    基于当前外部数据、IOT数据、非结构和半结构化数据进行大数据应用的规划,并论证实现过程和进行成本评估。一旦评估通过可以帮助企业进行大数据应用的完整开发和落地。

    数据可视化大屏

    数据可视化大屏,讲述数据背后的价值。在最短的时间内用最具冲击力的视觉语言,将企业最重要的数据/信息传递给最重要的人。

    袋鼠云数据中台七大数据服务
    通过上述服务内容,希望将企业数据资源情况完整展现,数据问题展现,数据资产情况展现,数据需求展现(传统数据分析方面、大数据应用方面)从而绘制一张完整的数据供应链地图,最终利用这张地图,辅助数据业务推进。

    第三:技术升级、应用便捷

    大数据平台在很长一段时间,甚至直至现在都还是以开源产品为主流的状况,开源产品使用费力,配置繁琐,导致大数据开发门槛高,数据应用受到严重阻碍,甚至在很多地方一直把大数据技术平台和传统的数仓做区别对待,认为大数据产品的特点是流式计算和处理非结构化数据。

    其实大数据产品如果能够降低使用门槛的话,会迅速替代传统数仓的技术产品。传统数仓无论在海量数据处理能力,节点扩展能力,实时计算能力,软件购买和维护成本等诸多方面都无法与当前的大数据平台进行抗衡。

    目前业内比较典型的就是阿里云数加平台,数加平台基本让数据开发者能够像使用传统数据库一样的使用大数据平台了,所有操作方式都是通过可视化界面进行,大部分的开发都是通过SQL语句来实现。当笔者使用数加产品时,总是回想起第一次使用java IDE(JBuild、Eclipse) 产品时的感受。

    袋鼠云数据中台产品(数栈)客观的说则是一款轻量化的,可私有部署的类数加产品,用以解决基于私有云的大数据平台的管理和开发问题。

    数据中台产品在与数加产品功能对比上不分伯仲,同时又基于私有云大数据应用的特点定制开发了诸多功能以及数据治理模块用以推动企业整体数据化进程。

    袋鼠云数栈产品体系

    袋鼠云数栈产品一览

    袋鼠云数栈产品一览
    袋鼠云数据中台建设与策略已经脱离了一个单纯的产品概念范畴,更多的是关注于企业的整体数据化建设工作,希望通过数栈产品和七大数据服务贴身参与用户全方位与全过程的数据化建设。同时我们期待这样的数据化建设应当是高效率,高应用价值和低成本的。

    2019-07-17 23:13:09
    赞同 展开评论 打赏
  • 擅长互联网移动开发。。。

    数据中台的概念由阿里巴巴首次提出,它是一个承接技术,引领业务,构建规范定义的、全域可连接萃取的、智慧的数据处理平台,建设目标是为了高效满足前台数据分析和应用的需求。数据中台是涵盖了数据资产、数据治理、数据模型、垂直数据中心、全域数据中心、萃取数据中心、数据服务等多个层次的体系化建设方法。

    2019-07-17 23:13:09
    赞同 展开评论 打赏
  • 数据中台跟传统的数据仓库不一样。传统的数据仓库,大部分数据来源于业务系统里面的关系型数据库。到了互联网时代,还有大量的数据来源于用户行为的埋点采集,未来万物互联的时代,还会有更多的数据来自于IoT。所以,数栈做为一站式数据中台PaaS,必须要解决多端数据采集和融合的问题。另外,还必须要解决数据计算统一的问题。传统的数据仓库能做到T+1的离线计算就已经可以了。但是互联网时代,比如双十一活动这样的场景,运营一定要实时的看到数据,数据的实时计算就越来越重要。2016年人工智能大潮再次兴起,未来智能化场景对于智能计算的需求也会不断涌现。从离线计算到实时计算,再到智能计算,每个场景是不是要搭一套独立的产品呢?其实数据中台可以来解决统一计算的问题,现在业内阿里云、袋鼠云已经帮助茅台、新华书店等不少知名企业客户搭建出数据中台了。

    2019-07-17 23:13:09
    赞同 2 展开评论 打赏
滑动查看更多
问答排行榜
最热
最新

相关电子书

更多
基于阿里云MaxCompute 构建企业云数据仓库CDW的最佳实践建议 立即下载
PostgresChina2018_陶征霖_新一代数据仓库OushuDB架构剖析 立即下载
MaxCompute数据仓库数据转换实践 立即下载