开发者社区 > 大数据与机器学习 > 大数据计算 MaxCompute > 正文

DataWorks 智能数据建模-业务痛点有哪些?

已解决

DataWorks 智能数据建模-业务痛点有哪些?

展开
收起
游客lmkkns5ck6auu 2022-09-14 18:33:08 646 0
1 条回答
写回答
取消 提交回答
  • 推荐回答

    从规范定义方面来讲,存在的主要问题是: Ÿ数仓规范与模型设计分离,符合规范的模型设计对建模师本身的要求 非常高,既要能把业务需求高度抽象进行模型设计,还需要牢记规范 的点点滴滴。 Ÿ 数据指标定义效率低,且指标的数据加工逻辑分离,过去传统的单个 创建指标效率相对低下,且无法保证指标的唯一性,指标的加工逻辑 和指标定义本身也存在脱节的情况,最终导致指标真实口径无法统一, 进而带来了大量的针对指标结果数据不一致的对焦工作。 Ÿ

    应用层缺少规范,大多数应用层的建设都面临需求多变、需求开发时间 紧、任务重的特点,也对应用层模型规范的管理带来了非常高的挑战。既要能够满足业务需求,又要能够符合规范,其实很难再短时间内完 成这些工作。

    从模型设计方面来讲,存在的主要问题是: Ÿ 纯人工的模型设计效率低下,比如要在 Excel 里做模型设计,并且需求 在 Excel 里做维护。

    从数据开发方面来讲,存在的主要问题是: Ÿ 模型设计和物理表开发分离,模型设计是模型设计,物理表开发是物 理表开发,很有可能会造成物理表开发逻辑与模型设计理念存在或多 或少的差异情况。此外,本地建模,还会存在着一些隐藏问题,如文件管理混乱、硬件设备故障、工作交接难等问题。

    以上内容摘自《阿里云云原生一体化数仓新能力解读》电子书,点击https://developer.aliyun.com/ebook/download/7725 可下载完整版

    2022-09-14 22:58:07
    赞同 展开评论 打赏

MaxCompute(原ODPS)是一项面向分析的大数据计算服务,它以Serverless架构提供快速、全托管的在线数据仓库服务,消除传统数据平台在资源扩展性和弹性方面的限制,最小化用户运维投入,使您经济并高效的分析处理海量数据。

相关电子书

更多
DataWorks数据集成实时同步最佳实践(含内测邀请)-2020飞天大数据平台实战应用第一季 立即下载
DataWorks调度任务迁移最佳实践-2020飞天大数据平台实战应用第一季 立即下载
基于DataWorks数据服务构建疫情大屏-2020飞天大数据平台实战应用第一季 立即下载