大模型
产品
解决方案
权益
定价
云市场
伙伴
服务
了解阿里云
查看 "" 全部搜索结果
AI 助理
文档
备案
控制台
开发者社区
首页
MaxCompute
Hologres
Flink
E-MapReduce
DataWorks
Elasticsearch
PAI
智能搜索推荐
Milvus
DataV
免费试用
探索云世界
热门
百炼大模型
Modelscope模型即服务
弹性计算
通义灵码
云原生
数据库
云效DevOps
龙蜥操作系统
云计算
弹性计算
无影
存储
网络
倚天
云原生
容器
serverless
中间件
微服务
可观测
消息队列
数据库
关系型数据库
NoSQL数据库
数据仓库
数据管理工具
PolarDB开源
向量数据库
大数据
大数据计算
实时数仓Hologres
实时计算Flink
E-MapReduce
DataWorks
Elasticsearch
机器学习平台PAI
智能搜索推荐
数据可视化DataV
人工智能
机器学习平台PAI
视觉智能开放平台
智能语音交互
自然语言处理
多模态模型
pythonsdk
通用模型
开发与运维
云效DevOps
钉钉宜搭
镜像站
开发者社区
大数据与机器学习
开源大数据平台 E-MapReduce
文章
正文
基于DLF构建实时数据湖
2026-02-14
268
版权
版权声明:
本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《
阿里云开发者社区用户服务协议
》和 《
阿里云开发者社区知识产权保护指引
》。如果您发现本社区中有涉嫌抄袭的内容,填写
侵权投诉表单
进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。
简介:
DLF
DLF产品的核心价值
管理和优化:
湖表管理和优化
统一元数据,引擎平权访问
存储数据冷热分层
企业级安全:
细粒度权限管控、列级权限、多引擎复用统一权限
数据跨主账号共享
访问日志、审计日志等
低成本:
高效湖表优化降低计算成本
IO吞吐优化降低IO成本
智能存储优化降低存储成本和Paimon上手成本
多模态:
文本,图像,视频,音频,多模态数据
支持Table视图和File视图
文章标签:
开源大数据平台 E-MapReduce
存储
安全
墨祤
目录
相关文章
墨祤
|
3月前
|
存储
运维
分布式计算
诗悦游戏基于DLF与EMR StarRocks降本38%
诗悦网络(2014年成立)是千人规模的研运一体手游公司,代表作有《长安幻想》《永夜降临》等。为支撑PB级开放世界新游《望月》,其原半托管StarRocks数据平台面临高成本、难运维、稳定性差等痛点。阿里云以Serverless StarRocks+DLF Paimon数据湖方案实现存算分离、多租户隔离与全托管运维,总成本降38%,查询性能提升40%+,RPO=0,全面赋能实时/近实时/离线场景。
墨祤
332
3
4
墨祤
|
3月前
|
存储
分布式计算
OLAP
数仓-湖仓-湖流,人力家基于阿里云OpenLake架构演进与思考
人力家资深数据工程师石玉阳(Thorne),Flink-CDC Contributor,分享其公司湖仓一体实践:以Paimon为数据基座、StarRocks为OLAP引擎、Flink+Fluss实现湖流融合,打通离线/实时/增量计算,支持多模态与DATA+AI演进,构建开放、统一、可持续的大数据架构。(239字)
墨祤
354
2
3
阿里云大数据
|
4月前
|
分布式计算
Serverless
测试技术
有奖实践:EMR Serverless StarRocks × Serverless Spark x DLF 共探 TPC 极致性能
免费试用 EMR Serverless StarRocks 与 EMR Serverless Spark,体验“实时分析冠军”与“批处理之神”的极致性能表现!
阿里云大数据
708
2
2
阿里云开发者
|
1月前
|
人工智能
安全
API
深度解析 Claude Code 在 Prompt / Context / Harness 的设计与实践
文章内容基于作者个人技术实践与独立思考,旨在分享经验,仅代表个人观点。
阿里云开发者
2938
75
83
墨祤
|
6月前
|
存储
人工智能
分布式计算
阿里云DLF 3.0:面向AI时代的智能全模态湖仓管理平台
在2025年云栖大会,阿里云发布DLF 3.0,升级为面向AI时代的智能全模态湖仓管理平台。支持结构化与非结构化数据统一管理,实现秒级实时处理、智能存储优化与细粒度安全控制,助力企业高效构建Data+AI基础设施。
墨祤
2118
3
3
阿里云大数据
|
3月前
|
存储
分布式计算
数据建模
淘宝闪购基于阿里云 EMR Serverless Spark&Paimon的湖仓实践:超大规模下的特征生产&多维分析双提效
本文介绍阿里云 Serverless Spark + Paimon 在淘宝闪购大数据湖仓场景的应用。
阿里云大数据
590
2
2
灵杰开发者
|
7月前
|
存储
分布式计算
运维
云栖实录|驰骋在数据洪流上:Flink+Hologres驱动零跑科技实时计算的应用与实践
零跑科技基于Flink构建一体化实时计算平台,应对智能网联汽车海量数据挑战。从车机信号实时分析到故障诊断,实现分钟级向秒级跃迁,提升性能3-5倍,降低存储成本。通过Flink+Hologres+MaxCompute技术栈,打造高效、稳定、可扩展的实时数仓,支撑100万台量产车背后的数据驱动决策,并迈向流批一体与AI融合的未来架构。
灵杰开发者
571
3
3
灵杰开发者
|
7月前
|
人工智能
数据处理
API
阿里云、Ververica、Confluent 与 LinkedIn 携手推进流式创新,共筑基于 Apache Flink Agents 的智能体 AI 未来
Apache Flink Agents 是由阿里云、Ververica、Confluent 与 LinkedIn 联合推出的开源子项目,旨在基于 Flink 构建可扩展、事件驱动的生产级 AI 智能体框架,实现数据与智能的实时融合。
灵杰开发者
1345
6
6
灵杰开发者
|
6月前
|
存储
SQL
缓存
Delta Join:为超大规模流处理实现计算与历史数据解耦
Delta Join(FLIP-486)是Flink流式Join的范式革新,通过将历史数据存储与计算解耦,实现按需查询外部存储(如Fluss、Paimon),避免状态无限增长。它解决了传统Join在高基数场景下的状态爆炸问题,显著降低资源消耗:状态减少50TB,成本降10倍,Checkpoint从小时级缩短至秒级,恢复速度提升87%。兼容标准SQL,自动优化转换,适用于海量数据实时关联场景,推动流处理迈向高效、稳定、可扩展的新阶段。
灵杰开发者
746
1
1
灵杰开发者
|
12月前
|
存储
Rust
Go
介绍一下这只小水獭 —— Fluss Logo 背后的故事
Fluss是一款开源流存储项目,致力于为Lakehouse架构提供高效的实时数据层。其全新Logo以一只踏浪前行的小水獭为核心形象,象征流动性、适应性和友好性。水獭灵感源于“Fluss”德语中“河流”的含义,传递灵活与亲和力。经过30多版设计迭代,最终呈现动态活力的视觉效果。Fluss计划捐赠给Apache软件基金会,目前已开启孵化提案。社区还推出了系列周边礼品,欢迎加入钉钉群109135004351参与交流!
灵杰开发者
1104
3
3
大数据与机器学习
开源大数据平台 E-MapReduce
热门文章
最新文章
1
阿里封神谈hadoop生态学习之路
2
分布式快照算法: Chandy-Lamport
3
如何使用Kafka Connect实现同步RDS binlog数据
4
Spark in action on Kubernetes - Playground搭建与架构浅析
5
梨视频:基于阿里云E-MapReduce搭建视频推荐系统的实践
6
JindoFS解析 - 云上大数据高性能数据湖存储方案
7
如何在Aliyun E-MapReduce集群上使用Zeppelin和Hue
8
HIVE MapJoin异常问题处理总结
9
5W1H(六何分析法)全景洞察大数据
10
玩转阿里云EMR三部曲-中级篇 集成自有服务
1
OpenClaw + QQ 机器人!保姆级图文教程,一步到位
291
2
1688商品详情API(1688.item_get)Python实战:构建B2B供应链数据中台
215
3
迅雷基于阿里云 EMR Serverless Spark 实现数仓资源效率与业务提升
213
4
鹰角网络:EMR Serverless Spark 在《明日方舟》游戏业务的应用
540
5
一套底座支撑多场景:高德地图基于 Paimon + StarRocks 轨迹服务实践
358
6
EMR Serverless Spark 携手 PAI/百炼,开启“SQL 即 AI”的新篇章
249
7
诗悦游戏基于DLF与EMR StarRocks降本38%
332
8
基于DLF构建实时数据湖
268
9
数仓-湖仓-湖流,人力家基于阿里云OpenLake架构演进与思考
354
10
淘宝闪购基于阿里云 EMR Serverless Spark&Paimon的湖仓实践:超大规模下的特征生产&多维分析双提效
590
相关电子书
更多
低代码开发师(初级)实战教程
冬季实战营第三期:MySQL数据库进阶实战
阿里巴巴DevOps 最佳实践手册
下一篇
阿里云正式发布 Agentic 代码安全:AI驱动的双Agent协同引擎