开发者社区 > 大数据与机器学习 > 大数据计算 MaxCompute > 正文

批流结合的数据架构包括哪些?

已解决

批流结合的数据架构包括哪些?

展开
收起
游客lmkkns5ck6auu 2022-08-16 14:52:49 270 0
1 条回答
写回答
取消 提交回答
  • 推荐回答

    数据从不同数据源过来,如 API,OTS,ROS,log,file 等,一方面数据要在实时计算当中做 URL 去重,正文结构化,标记来源,垃圾识别,实体识别和轻度的实时统计。另外基于 MaxCompute,利用 DataHub 将数据存储在批处理平台中,由于流计算本身不做持久化存储,所以所有数据都将存储在 MaxCompute 上。

    数据存储之后做主题建设,关系挖掘,知识图谱计算,算法训练。通过批流结合的的处理方式能够满足客户对数据本身能力的需要。之后,给用户提供搜索能力,大屏能力和BI 能力等。

    以上内容摘自《5天入门视觉AI》电子书,点击https://developer.aliyun.com/topic/download?id=31可下载完整版

    2022-08-17 16:42:48
    赞同 展开评论 打赏

MaxCompute(原ODPS)是一项面向分析的大数据计算服务,它以Serverless架构提供快速、全托管的在线数据仓库服务,消除传统数据平台在资源扩展性和弹性方面的限制,最小化用户运维投入,使您经济并高效的分析处理海量数据。

热门讨论

热门文章

相关电子书

更多
基于MaxCompute快速打通数仓和数据湖:湖仓一体实践 立即下载
离线实时一体化数仓与湖仓一体—云原生大数据平台的持续演进 立即下载
MaxCompute湖仓一体介绍-下一代大数据平台演进 立即下载