开发者社区 > 大数据与机器学习 > 大数据开发治理DataWorks > 正文

线下的数据建模有哪些弊端?

线下的数据建模有哪些弊端?

展开
收起
白夜行fighting 2023-01-11 15:26:37 515 0
1 条回答
写回答
取消 提交回答
  • 线下建模的弊端主要体现在三大方面:规范定义、模型设计、数据开发。

    1. 从规范定义方面来讲,数仓规范与模型设计分离,符合规范的模型设计对建模师本身的要求非常高,既要能把业务需求高度抽象进行模型设计,还需要牢记规范的点点滴滴。数据指标定义效率低,且指标的数据加工逻辑分离,过去传统的单个创建指标效率相对低下,且无法保证指标的唯一性。,指标的加工逻辑和指标定义本身也存在脱节的情况,最终导致指标真实口径无法统一,进而带来了大量的针对指标结果数据不一致的对焦工作。应用层缺少规范,大多数应用层的建设都面临需求多变、需求开发时间紧、任务重的特点,也对应用层模型规范的管理带来了非常高的挑战

    2. 从模型设计方面来讲,纯人工的模型设计效率低下,比如要在excel 里做模型设计,并且需求在excel 里做维护。

    3. 从数据开发方面来讲,模型设计和物理表开发分离,模型设计是模型设计,物理表开发是物理表开发,很有可能会造成物理表开发逻辑与模型设计理念存在或多或少的差异情况。

    《全链路数据治理-智能数据建模》电子书,点https://developer.aliyun.com/ebook/download/7845 可下载完整版

    2023-01-11 16:37:55
    赞同 展开评论 打赏

DataWorks基于MaxCompute/Hologres/EMR/CDP等大数据引擎,为数据仓库/数据湖/湖仓一体等解决方案提供统一的全链路大数据开发治理平台。

热门讨论

热门文章

相关电子书

更多
低代码开发师(初级)实战教程 立即下载
冬季实战营第三期:MySQL数据库进阶实战 立即下载
阿里巴巴DevOps 最佳实践手册 立即下载