美柚基于DLF构建实时数据湖

简介: 厦门美柚面临Hudi数据湖实时性不足(延时达小时/天级)、运维复杂、资源弹性差等痛点。阿里云以DLF(Paimon)+ Flink VVP + Serverless Spark构建近实时湖仓,实现端到端10分钟内数据可见、CU成本降33.3%、开发效率提升30%,全面支撑其广告与健康业务实时画像需求。

客户简介

厦门美柚股份有限公司成立于2013年11月19日,最初以女性经期管理工具App切入市场,逐步构建起覆盖女性全生命周期的“工具+社区+电商”商业闭环。其主营业务包括为女性用户提供经期、备孕、孕期及育儿等健康管理服务,并依托庞大的用户基础,为广告主和电商商家提供精准的数字营销与电商服务。

客户行业

移动互联网中的大健康行业,具体聚焦于女性生活服务与数字健康领域。

客户业务场景

实时业务报表、OLAP分析。实时画像标签,要求端到端5分钟延时数据可见性。

客户痛点及面临的挑战

广告和 女性健康业务有实时用户画像标签的需求,要求端到端5分钟延时数据可见性。而客户之前以友商云上Spark为核心建设了大数据平台,数据加工以离线为主,湖格式采用的是hudi。时效性一般为天级别,部分为小时级,极少量实时场景采用Flink+kafka,存在lamda架构带来的各类问题。因此现有hudi数据湖无法满足日益增长的实时业务诉求,希望采用阿里云Paimon数据湖技术,建设近实时湖仓架构,提升数据新鲜度,提升部分业务场景例如广告监控的时效性。同时提升实时链路稳定性,降低业务使用成本。

除此之外,还有以下痛点:

  • 数据开发:现有Flink开发缺少udf函数管理功能;现有hudi表的元数据缺少表参数、快照等信息的维护,开发维护不方便。
  • 任务运维:现有Flink任务缺少AI诊断功能,缺少必要的监控指标,无法进行算子粒度配置资源。
  • 数据湖能力:当前使用hudi数据湖,针对已有湖表,修改元数据,必须停读停写。Compaction资源无法灵活控制,执行时间也不稳定。
  • 灵活弹性资源:当前引擎无法按量计费,缺乏计算资源灵活弹性伸缩的能力。

客户核心需求

功能性需求

非功能性需求

阿里云解决方案

使用的产品:

  • DLF:统一湖仓数据和元数据管理DLF(paimon),全托管,免运维。
  • Flink VVP:统一流式数据加工Flink,高性能计算引擎,全链路可观测。
  • Serverless Spark:离线数据读写Serverless Spark ,按需计算、资源灵活弹性。

方案架构图:

方案要点:

  1. 大数据架构升级:使用阿里云商业化Paimon数据湖仓平台DLF,阿里云实时引擎Flink 和离线引擎Serverless Spark。支持单表多任务并发写入,支持元数据实时变更、部分列更新,解决hudi天然架构问题。
  2. 统一数据湖仓:使用全托管DLF-Paimon数据湖,统一数据存储,真正实现数据one copy;避免数据割裂,保证数据一致性。除此之外, 阿里云DLF还提供统一的数据和元数据管理;统一的权限管理;自动存储优化,包括但不限于小文件合并,过期快照清理,分区整理等优化策略。
  3. 全链路实时开发调试,提升数据新鲜度:阿里云Flink+DLF Paimon数据实时写入分钟可见。Flink 提供极致性能和一站式可视化的开发调试体验;完善的运维管理和监控告警功能;同城高可用架构,全链路自动容错能力。
  4. 离线引擎无缝读写:Serverless Spark 除了提供完善的针对DLF的读写功能外,在性能调优方面做了特殊的优化,让DLF真正做到引擎高效平权使用。
  5. 资源优化:阿里云DLF产品提供全托管的存储优化,包括小文件合并等,compaction资源从flink任务重剥离出来,并支持计算资源自动优化,既减少了任务开发运维负担,也提升了实时任务的写入性能;可节省至少30%的计算资源开销,降低使用成本。
  6. 开发提效:该方案支持全链路开发、调试、智能诊断、智能调优、监控告警,保证实时任务稳定运行,可观测。尤其是DLF完善的元数据管理、Serverless spark灵活的资源弹性、Flink丰富的任务诊断工具,相比原有开发效率有30%提升。

解决方案带来的核心价值

  1. 实时任务开发效率提升30%:
  • 阿里云Flink任务启动停止耗时明显优于华为云CS
  • 阿里云Flink具备完善的AI智能诊断,监控指标告警。
  • 阿里云Flink支持UDF函数管理
  • 阿里云Flink支持细粒度的资源配置优化

  1. 实时计算CU消耗降低33.3% :
  • 实测客户女性健康业务,实时画像标签加工;结合阿里云DLF存储优化,智能compaction的能力,整体计算资源消耗由原来的656CU降到了492CU。

  1. 端到端数据可见延时降低100%+ :
  • 选取逻辑加工最复杂的链路进行实测,针对最终画像标签表,华为hudi仅compaction就要20分钟以上,而阿里云paimon,端到端数据可见稳定保证在10分钟以内可见

DLF产品的核心价值

  1. 管理和优化:
  • 湖表管理和优化
  • 统一元数据,引擎平权访问
  • 存储数据冷热分层

  1. 企业级安全:
  • 细粒度权限管控、列级权限、多引擎复用统一权限
  • 数据跨主账号共享
  • 访问日志、审计日志等

  1. 低成本:
  • 高效湖表优化降低计算成本
  • IO吞吐优化降低IO成本
  • 智能存储优化降低存储成本和Paimon上手成本

  1. 多模态:
  • 文本,图像,视频,音频,多模态数据
  • 支持Table视图和File视图

目录
相关文章
|
17天前
|
人工智能 自然语言处理 Shell
🦞 如何在 OpenClaw (Clawdbot/Moltbot) 配置阿里云百炼 API
本教程指导用户在开源AI助手Clawdbot中集成阿里云百炼API,涵盖安装Clawdbot、获取百炼API Key、配置环境变量与模型参数、验证调用等完整流程,支持Qwen3-max thinking (Qwen3-Max-2026-01-23)/Qwen - Plus等主流模型,助力本地化智能自动化。
31257 108
🦞 如何在 OpenClaw (Clawdbot/Moltbot) 配置阿里云百炼 API
|
7天前
|
应用服务中间件 API 网络安全
3分钟汉化OpenClaw,使用Docker快速部署启动OpenClaw(Clawdbot)教程
2026年全新推出的OpenClaw汉化版,是基于Claude API开发的智能对话系统本土化优化版本,解决了原版英文界面的使用壁垒,实现了界面、文档、指令的全中文适配。该版本采用Docker容器化部署方案,开箱即用,支持Linux、macOS、Windows全平台运行,适配个人、企业、生产等多种使用场景,同时具备灵活的配置选项和强大的扩展能力。本文将从项目简介、部署前准备、快速部署、详细配置、问题排查、监控维护等方面,提供完整的部署与使用指南,文中包含实操代码命令,确保不同技术水平的用户都能快速落地使用。
4521 1
|
13天前
|
人工智能 安全 机器人
OpenClaw(原 Clawdbot)钉钉对接保姆级教程 手把手教你打造自己的 AI 助手
OpenClaw(原Clawdbot)是一款开源本地AI助手,支持钉钉、飞书等多平台接入。本教程手把手指导Linux下部署与钉钉机器人对接,涵盖环境配置、模型选择(如Qwen)、权限设置及调试,助你快速打造私有、安全、高权限的专属AI助理。(239字)
6518 17
OpenClaw(原 Clawdbot)钉钉对接保姆级教程 手把手教你打造自己的 AI 助手
|
12天前
|
人工智能 机器人 Linux
OpenClaw(Clawdbot、Moltbot)汉化版部署教程指南(零门槛)
OpenClaw作为2026年GitHub上增长最快的开源项目之一,一周内Stars从7800飙升至12万+,其核心优势在于打破传统聊天机器人的局限,能真正执行读写文件、运行脚本、浏览器自动化等实操任务。但原版全英文界面对中文用户存在上手门槛,汉化版通过覆盖命令行(CLI)与网页控制台(Dashboard)核心模块,解决了语言障碍,同时保持与官方版本的实时同步,确保新功能最快1小时内可用。本文将详细拆解汉化版OpenClaw的搭建流程,涵盖本地安装、Docker部署、服务器远程访问等场景,同时提供环境适配、问题排查与国内应用集成方案,助力中文用户高效搭建专属AI助手。
4570 9
|
14天前
|
人工智能 机器人 Linux
保姆级 OpenClaw (原 Clawdbot)飞书对接教程 手把手教你搭建 AI 助手
OpenClaw(原Clawdbot)是一款开源本地AI智能体,支持飞书等多平台对接。本教程手把手教你Linux下部署,实现数据私有、系统控制、网页浏览与代码编写,全程保姆级操作,240字内搞定专属AI助手搭建!
5528 19
保姆级 OpenClaw (原 Clawdbot)飞书对接教程 手把手教你搭建 AI 助手
|
14天前
|
存储 人工智能 机器人
OpenClaw是什么?阿里云OpenClaw(原Clawdbot/Moltbot)一键部署官方教程参考
OpenClaw是什么?OpenClaw(原Clawdbot/Moltbot)是一款实用的个人AI助理,能够24小时响应指令并执行任务,如处理文件、查询信息、自动化协同等。阿里云推出的OpenClaw一键部署方案,简化了复杂配置流程,用户无需专业技术储备,即可快速在轻量应用服务器上启用该服务,打造专属AI助理。本文将详细拆解部署全流程、进阶功能配置及常见问题解决方案,确保不改变原意且无营销表述。
6050 5
|
16天前
|
人工智能 JavaScript 应用服务中间件
零门槛部署本地AI助手:Windows系统Moltbot(Clawdbot)保姆级教程
Moltbot(原Clawdbot)是一款功能全面的智能体AI助手,不仅能通过聊天互动响应需求,还具备“动手”和“跑腿”能力——“手”可读写本地文件、执行代码、操控命令行,“脚”能联网搜索、访问网页并分析内容,“大脑”则可接入Qwen、OpenAI等云端API,或利用本地GPU运行模型。本教程专为Windows系统用户打造,从环境搭建到问题排查,详细拆解全流程,即使无技术基础也能顺利部署本地AI助理。
7694 17
|
10天前
|
人工智能 JavaScript 安全
Claude Code 安装指南
Claude Code 是 Anthropic 推出的本地 AI 编程助手,支持 Mac/Linux/WSL/Windows 多平台一键安装(Shell/PowerShell/Homebrew/NPM),提供 CLI 交互、代码生成、审查、Git 提交等能力,并内置丰富斜杠命令与自动更新机制。
3809 0