开发者社区阿里云最佳实践文章正文

互联网、游戏等行业实时数仓构建

2020-12-04 1678

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 基于Flink构建实时数仓，包含采集日志，Flink对日志的拆分、处理写入ADB存储和HDFS。

直达最佳实践：【互联网、游戏等行业实时数仓构建】
最佳实践频道：【点击查看更多上云最佳实践】

这里有丰富的企业上云最佳实践，从典型场景入门，提供一系列项目实践方案，降低企业上云门槛的同时满足您的需求！

场景描述

互联网、游戏等行业客户基于Flink构建实时数仓，通过Logtail采集日志，使用Flink实现对日志的拆分、处理，根据业务需求写入不同的数据存储，实时分析使用ADB存储、离线分析使用HDFS存储，构建高效、稳健的实时数据服务。

解决问题

日志采集、处理及分析
日志使用Flink拆分到不同logstore
日志使用Flink实时写入HDFS
日志数据实时ETL
日志实时写入ADB

产品列表

实时计算
EMR
云数据库HBase版
云数据库RDS
弹性公网IP EIP
专有网络VPC
云服务器ECS

直达最佳实践》》

文章标签：

实时数仓 Hologres

实时计算 Flink版

日志服务

流计算

弹性计算

关系型数据库

网络安全

Hbase

RDS

数据库

存储

分布式数据库

关键词：

实时数仓 Hologres构建

云原生数据仓库AnalyticDB MySQL版构建

实时数仓 Hologres游戏

互联网云原生数据仓库AnalyticDB MySQL版

相关实践学习

基于Hologres轻量实时的高性能OLAP分析

本教程基于GitHub Archive公开数据集，通过DataWorks将GitHub中的项⽬、行为等20多种事件类型数据实时采集至Hologres进行分析，同时使用DataV内置模板，快速搭建实时可视化数据大屏，从开发者、项⽬、编程语⾔等多个维度了解GitHub实时数据变化情况。

最佳实践小文

游客7wkr3y7oxyt7a

10月前

机器学习/深度学习算法大数据

构建数据中台，为什么“湖仓一体”成了大厂标配？

在大数据时代，数据湖与数据仓库各具优势，但单一架构难以应对复杂业务需求。湖仓一体通过融合数据湖的灵活性与数据仓的规范性，实现数据分层治理、统一调度，既能承载海量多源数据，又能支撑高效分析决策，成为企业构建数据中台、推动智能化转型的关键路径。

游客7wkr3y7oxyt7a

662 0 0

阿里云大数据Al技术

人工智能自然语言处理数据挖掘

云上玩转Qwen3系列之三：PAI-LangStudio x Hologres构建ChatBI数据分析Agent应用

PAI-LangStudio 和 Qwen3 构建基于 MCP 协议的 Hologres ChatBI 智能 Agent 应用，通过将 Agent、MCP Server 等技术和阿里最新的推理模型 Qwen3 编排在一个应用流中，为大模型提供了 MCP+OLAP 的智能数据分析能力，使用自然语言即可实现 OLAP 数据分析的查询效果，减少了幻觉。开发者可以基于该模板进行灵活扩展和二次开发，以满足特定场景的需求。

阿里云大数据Al技术

847 4 5

云浠Cherry

人工智能关系型数据库 OLAP

光云科技 X AnalyticDB：构建 AI 时代下的云原生企业级数仓

AnalyticDB承载了光云海量数据的实时在线分析，为各个业务线的商家提供了丝滑的数据服务，实时物化视图、租户资源隔离、冷热分离等企业级特性，很好的解决了SaaS场景下的业务痛点，也平衡了成本。同时也基于通义+AnalyticDB研发了企业级智能客服、智能导购等行业解决方案，借助大模型和云计算为商家赋能。

云浠Cherry

1033 17 17

实时数仓Hologres团队

存储消息中间件分布式计算

Hologres实时数仓在B站游戏的建设与实践

本文介绍了B站游戏业务中实时数据仓库的构建与优化过程。为满足日益增长的数据实时性需求，采用了Hologres作为核心组件优化传统Lambda架构，实现了存储层面的流批一体化及离线-实时数据的无缝衔接。文章详细描述了架构选型、分层设计（ODS、DWD、DIM、ADS）及关键技术挑战的解决方法，如高QPS点查、数据乱序重写等。目前，该实时数仓已广泛应用于运营分析、广告投放等多个场景，并计划进一步完善实时指标体系、扩展明细层应用及研发数据实时解析能力。

实时数仓Hologres团队

927 0 0

实时数仓Hologres团队

11月前

分布式计算 Serverless OLAP

实时数仓Hologres V3.1版本发布，Serverless型实例从零开始构建OLAP系统

Hologres推出Serverless型实例，支持按需计费、无需独享资源，适合新业务探索分析。高性能查询内表及MaxCompute/OSS外表，弹性扩展至512CU，性能媲美主流开源产品。新增Dynamic Table升级、直读架构优化及ChatBI解决方案，助力高效数据分析。

实时数仓Hologres团队

1410 2 3

实时数仓Hologres V3.1版本发布，Serverless型实例从零开始构建OLAP系统

实时数仓Hologres团队

自然语言处理安全数据挖掘

Hologres+函数计算+Qwen3，对接MCP构建企业级数据分析 Agent

本文介绍了通过阿里云Hologres、函数计算FC和通义千问Qwen3构建企业级数据分析Agent的解决方案。大模型在数据分析中潜力巨大，但面临实时数据接入与跨系统整合等挑战。MCP（模型上下文协议）提供标准化接口，实现AI模型与外部资源解耦。方案利用SSE模式连接，具备高实时性、良好解耦性和轻量级特性。Hologres作为高性能实时数仓，支持多源数据毫秒级接入与分析；函数计算FC以Serverless模式部署，弹性扩缩降低成本；Qwen3则具备强大的推理与多语言能力。用户可通过ModelScope的MCP Playground快速体验，结合TPC-H样例数据完成复杂查询任务。

实时数仓Hologres团队

1050 38 39

阿里云大数据

存储分布式计算物联网

美的楼宇科技基于阿里云 EMR Serverless Spark 构建 LakeHouse 湖仓数据平台

美的楼宇科技基于阿里云 EMR Serverless Spark 建设 IoT 数据平台，实现了数据与 AI 技术的有效融合，解决了美的楼宇科技设备数据量庞大且持续增长、数据半结构化、数据价值缺乏深度挖掘的痛点问题。并结合 EMR Serverless StarRocks 搭建了 Lakehouse 平台，最终实现不同场景下整体性能提升50%以上，同时综合成本下降30%。

阿里云大数据

1140 58 58

探索云世界

11月前

存储 SQL 分布式计算

MaxCompute x 聚水潭：基于近实时数仓解决方案构建统一增全量一体化数据链路

聚水潭作为中国领先的电商SaaS ERP服务商，致力于为88,400+客户提供全链路数字化解决方案。其核心ERP产品助力企业实现数据驱动的智能决策。为应对业务扩展带来的数据处理挑战，聚水潭采用MaxCompute近实时数仓Delta Table方案，有效提升数据新鲜度和计算效率，提效比例超200%，资源消耗显著降低。未来，聚水潭将进一步优化数据链路，结合MaxQA实现实时分析，赋能商家快速响应市场变化。

探索云世界

475 0 0

灵杰开发者

SQL 监控关系型数据库

用友畅捷通在Flink上构建实时数仓、挑战与最佳实践

本文整理自用友畅捷通数据架构师王龙强在FFA2024上的分享，介绍了公司在Flink上构建实时数仓的经验。内容涵盖业务背景、数仓建设、当前挑战、最佳实践和未来展望。随着数据量增长，公司面临数据库性能瓶颈及实时数据处理需求，通过引入Flink技术逐步解决了数据同步、链路稳定性和表结构差异等问题，并计划在未来进一步优化链路稳定性、探索湖仓一体架构以及结合AI技术推进数据资源高效利用。

灵杰开发者

988 25 26

灵杰开发者

存储人工智能分布式计算

湖仓实时化升级：Uniflow 构建流批一体实时湖仓

本文整理自阿里云产品经理李昊哲在Flink Forward Asia 2024流批一体专场的分享，涵盖实时湖仓发展趋势、基于Flink搭建流批一体实时湖仓及Materialized Table优化三方面。首先探讨了实时湖仓的发展趋势和背景，特别是阿里云在该领域的领导地位。接着介绍了Uniflow解决方案，通过Flink CDC、Paimon存储等技术实现低成本、高性能的流批一体处理。最后，重点讲解了Materialized Table如何简化用户操作，提升数据查询和补数体验，助力企业高效应对不同业务需求。

灵杰开发者

1207 18 21

互联网、游戏等行业实时数仓构建

场景描述

解决问题

产品列表

阿里云最佳实践

热门文章

最新文章

相关课程

相关电子书

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

互联网、游戏等行业实时数仓构建

场景描述

解决问题

产品列表

阿里云最佳实践

热门文章

最新文章

相关课程

相关电子书