开发者社区 问答 正文

为了解决传统数仓的问题,出现了哪些新的解决思路?

为了解决传统数仓的问题,出现了哪些新的解决思路?

展开
收起
游客ylpqnllv5wbak 2021-10-20 16:35:06 380 分享 版权
阿里云 AI 助理回答

为解决传统数仓存在的问题,如延时长、成本高、架构复杂、组件繁多、运维难度大及数据冗余等,出现了以下新的解决思路和技术方案:

  1. 流式湖仓方案

    • 实时计算集成:利用Apache Flink等实时计算引擎,实现数据的实时流动与处理,缩短数据处理周期,提高时效性。
    • 流式数据湖仓技术(如Paimon):提供高效的更新能力,使得数据变更能在分钟级延迟内传递给下游消费者,同时支持结构化、半结构化和非结构化数据的统一管理。
    • 分析型数据库优化:使用如StarRocks的高性能分析型数据库,直接读取湖仓数据,加速查询分析服务,降低查询延迟。
  2. 列式JSON存储与处理技术

    • IMCI技术(如PolarDB IMCI):通过列式JSON存储、虚拟列、秒级加减列等功能,提升半结构化数据的查询性能,同时保持架构灵活性,减少因业务需求变动导致的表结构频繁调整。
  3. 统一计算架构

    • Dynamic Table技术(如Hologres Dynamic Table):支持全量刷新和增量刷新模式,能够自动或按需刷新数据,结合流批一体的能力,简化数据仓库架构,平衡性能、成本与实时性需求。
  4. IDMapping与图计算在离线一体化解决方案中的应用

    • 跨域用户识别与数据整合:通过IDMapping技术解决跨业务、跨设备的用户身份识别问题,支撑个性化推荐、风控等场景。
    • GraphCompute引擎:在离线架构中运用图计算技术,高效处理复杂关系数据,无缝对接数据处理层与上层业务查询,增强数据分析的深度和广度。

这些新思路和技术通过引入实时处理、优化数据存储格式、统一计算框架以及高级用户识别技术,有效提升了数据处理的效率、灵活性和成本效益,满足了现代企业对大数据处理的更高要求。

有帮助
无帮助
AI 助理回答生成答案可能存在不准确,仅供参考
0 条回答
写回答
取消 提交回答