DataWorks x 婚礼纪:智能一站式数据开发治理平台让千万新人的幸福时刻“数智化”

本文涉及的产品
大数据开发治理平台DataWorks,资源组抵扣包 750CU*H
简介: 婚礼纪是杭州火烧云科技推出的结婚服务平台,覆盖婚宴酒店、婚纱摄影等全产业链,年服务超2000万对新人。为应对海量数据处理挑战,婚礼纪选择阿里云DataWorks作为一站式大数据开发治理平台,解决数据血缘不清、指标口径混乱等问题。通过湖仓一体架构与全链路数据治理,实现多源异构数据高效整合,支撑精准营销、交易风控等核心场景。DataWorks新版数据开发Data Studio大幅提升开发效率,Copilot智能助手优化SQL代码生成与测试,助力婚礼纪构建数据驱动的结婚产业服务中枢。

婚礼纪的数据化使命


婚礼纪是杭州火烧云科技有限公司推出的结婚服务平台,业务覆盖婚宴酒店、婚纱摄影、婚礼策划等结婚服务全产业链,致力于打造满足结婚一切所需的全能服务生态,平台年服务超2000万对新人,合作商家超20万家。

婚礼纪作为互联网结婚产业SaaS平台,构建结婚产业级数字底座,服务商家数字化管理、营销分析及供应链协同,提供数据资产化服务。在数字化服务场景中,涉及海量数据的处理和应用,这些数据资产在营销、订单、风控、支付等核心业务模块间智能流转,形成数据驱动的业务闭环。

  • 用户行为分析:日均处理 4-5 亿条用户行为日志,涵盖浏览轨迹、收藏偏好、咨询热点等多维用户画像数据构建
  • 非结构化数据管理:管理千万级婚纱影像资产库,支持VR场地实景漫游、用户评价、视觉检索等多场景
  • 交易智能中枢:年承载超百亿级交易流水,实现毫秒级优惠核销、智能商家结算及动态风控监测

在数字化转型加速推进的背景下,如何处理婚礼服务场景中多源异构数据的指数级增长,如何通实现毫秒级数据响应;如何突破传统数据应用范式通过AI提效,都是婚礼纪在数据资产价值挖掘与技术创新驱动业务增长方面面临的多维度挑战。

为何选择 DataWorks?


为了满足婚礼纪业务决策、数据分析和服务监控等需求,婚礼纪的技术团队起初通过自研的方式来构建数据仓库,但随着数据仓库建设的发展,数据血缘不清晰、指标口径混乱、调度系统不稳定等问题逐渐暴露出来。于是婚礼纪的技术团队开始寻找新的解决方案,在选型中发现阿里云DataWorks作为一站式大数据开发治理平台可以很好的解决目前遇到的问题。DataWorks是阿里云沉淀10余年大数据建设经验的平台,覆盖数据开发治理的全生命周期,具备智能易用的Data+AI一体化开发能力,护航数据全生命周期安全管理,同时平台开放灵活,可满足企业级多场景需求,在对比自研的投入产出和迁移的投入产出以及数仓未来建设发展等综合因素考量下,婚礼纪选择将整个大数据平台架构换新,采用DataWorks作为一站式数据开发与治理平台。初期在使用的过程中遇到一些困难,如无法批量检索未设置重试的作业、平台不支持Python节点等问题,随着DataWorks产品功能的快速迭代及新版本数据开发Data Studio的发布,这些问题也逐步得到解决。目前,婚礼纪平台的线上 DataWorks 作业持续稳定运行。

阿里云的解决方案


婚礼纪使用阿里云大数据产品DataWorks搭建大数据平台,首先通过DataWorks数据建模能力进行数仓分层建设、数据标准建设以及数据指标体系构建,解决指标口径混乱、管理不规范等问题。日志数据、业务数据通过DataWorks数据集成进入OSS-HDFS数据湖,离线链路通过Spark、Hive引擎根据规范的数据模型进行分层加工,实时数据通过Flink实时进入Paimon数据湖,构建湖仓一体方案,上层采用Trion、Doris进行交互式分析。数据开发平台统一基于DataWorks新版数据开发Data Studio进行开发、调度和运维,全链路血缘、数据质量和数据治理能力在数据平台内也得到了广泛应用。

数据开发智能升级,重构数据开发生产力


在使用DataWorks旧版数据开发Data Studio过程中,婚礼纪逐渐遇到了一些问题:

  • 旧版本无Python节点,Python作业无法实现,无法适应多场景任务
  • 旧版本对于数据处理流程自动化管理能力较弱,不能清晰了解任务上下游关系

迁移到新版数据开发Data Studio后,婚礼纪的数据开发效率实现了明显提升:

  • 通过对Python节点的支持,平台可以支持更加丰富的作业类型,帮助婚礼纪业务实现了如通过Trino做计算引擎然后存储到Doris中等场景,使得婚礼纪大数据平台能在多角度支撑业务决策。
  • 婚礼纪使用工作流---数据处理流程自动化管理工具,通过可视化拖拽方式整合多种类型的子任务节点,包括编排多种大数据和AI引擎的数据开发节点,同时工作流也可作为整体被其他节点依赖,便捷地建立任务上下游关系,加速数据处理流程的搭建,有效提升任务开发便捷度。
  • 统一元数据管理,婚礼纪通过多样化的建表方式,借助辅助智能建表,提升数据研发效率,满足了不同角色用户多样化元数据创建及管理的需求。
  • 婚礼纪使用智能诊断功能对任务进行全链路分析,更加智能的任务异常诊断能力,显著提高了任务诊断的效率。

DataWorks Copilot 智能助手,拉满产品使用体验

婚礼纪借助DataWorks Copilot智能助手通过自然语言交互完成更为复杂的SQL代码生成、优化、测试等操作,显著提升数据开发效率,实现多场景便捷应用:

  • SQL语句的生成、纠错、优化
  • SQL格式转换,将多行转单行(适用于数据集成脚本模式)
  • 语言转换:Python udf 转 java
  • 智能找表、智能建表、生成表结构
  • 优化多个计算引擎参数解析
  • 当作DataWorks 内部搜索引擎

令婚礼纪技术团队惊喜的是,Copilot 除解答问题较为精准外,同时具备分析能力,在解答完问题后,会考虑到关联场景并延伸分析下去,同时Copilot目前支持默认模型、Qwen3、DeepSeek等系列大语言模型,可自由切换以寻找更优解。

客户证言


“DataWorks新版数据开发Data Studio的成功迁移,使得婚礼纪的数据开发流程更标准化,开发效率更高,调度系统更稳定。数据的血缘解析精准,依赖设置方便。对比使用旧版数据开发,同等体量项目的开发时间可综合提效50%,实现了数据开发效率的跃迁。”

——婚礼纪大数据平台技术团队 凉风、七岁、句号、轻行

总结展望


婚礼纪基于DataWorks构建的企业级大数据平台,通过湖仓一体架构与全链路数据治理体系,实现了多源异构数据的高效整合与价值挖掘,有效支撑了婚礼纪精准营销策略优化、智能广告投放、交易风控体系以及用户行为分析等核心业务场景。未来 ,婚礼纪将加强和DataWorks的合作,聚焦DataWorks平台的智能化演进方向,深度探索Data+AI一体化开发、DataWorks AI Agent等能力,形成以数据智能驱动的结婚产业服务中枢,继续为千万新人提供满足结婚一切所需的全能服务生态,创造更多幸福与美好!

相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
一站式大数据开发治理平台DataWorks初级课程
DataWorks 从 2009 年开始,十ー年里一直支持阿里巴巴集团内部数据中台的建设,2019 年双 11 稳定支撑每日千万级的任务调度。每天阿里巴巴内部有数万名数据和算法工程师正在使用DataWorks,承了阿里巴巴 99%的据业务构建。本课程主要介绍了阿里巴巴大数据技术发展历程与 DataWorks 几大模块的基本能力。 产品官网 https://www.aliyun.com/product/bigdata/ide 大数据&AI体验馆 https://workbench.data.aliyun.com/experience.htm#/ 帮助文档https://help.aliyun.com/zh/dataworks 课程目标  通过讲师的详细讲解与实际演示,学员可以一边学习一边进行实际操作,可以深入了解DataWorks各大模块的使用方式和具体功能,让学员对DataWorks数据集成、开发、分析、运维、安全、治理等方面有深刻的了解,加深对阿里云大数据产品体系的理解与认识。 适合人群  企业数据仓库开发人员  大数据平台开发人员  数据分析师  大数据运维人员  对于大数据平台、数据中台产品感兴趣的开发者
相关文章
|
3月前
|
人工智能 自然语言处理 DataWorks
DataWorks Copilot 集成Qwen3-235B-A22B混合推理模型,数据开发与分析效率再升级!
阿里云DataWorks平台正式接入Qwen3模型,支持最大235B参数量。用户可通过DataWorks Copilot智能助手调用该模型,以自然语言交互实现代码生成、优化、解释及纠错等功能,大幅提升数据开发与分析效率。Qwen3作为最新一代大语言模型,具备混合专家(MoE)和稠密(Dense)架构,适应多种应用场景,并支持MCP协议优化复杂任务处理。目前,用户可通过DataWorks Data Studio新版本体验此功能。
302 23
DataWorks Copilot 集成Qwen3-235B-A22B混合推理模型,数据开发与分析效率再升级!
|
6月前
|
SQL 分布式计算 DataWorks
活动实践 | DataWorks智能交互式数据开发与分析之旅
本指南介绍了如何使用阿里云平台进行大数据开发与分析。首先,在MaxCompute控制台创建项目并配置计算资源;接着,通过DataWorks控制台创建工作空间和独享资源组,并绑定工作空间。然后,创建个人开发环境,载入案例并新建Notebook实例。在Notebook中,通过SQL和Python Cell进行交互式开发和数据分析,体验智能助手Copilot的功能,如SQL改写、解释、生成注释及智能建表。最后,清理所有创建的资源,包括删除DataWorks资源、MaxCompute项目及网络配置,确保环境整洁。
|
4月前
|
自然语言处理 DataWorks 数据挖掘
使用DataWorks Notebook实现智能图片标注,给你的图片加个“注释”
本文介绍如何使用DataWorks Notebook结合视觉识别模型RAM和自然语言处理模型BERT实现多模态图片标注,为智能内容生成和多模态数据分析的广泛应用提供支持。
|
5月前
|
人工智能 自然语言处理 DataWorks
DataWorks X DeepSeek : 用AI实现数据开发治理!
阿里云DataWorks正式接入DeepSeek-R1系列模型,用户可通过DataWorks Copilot智能助手,以自然语言交互完成代码操作,实现数据开发、分析与治理全流程。DataWorks内置阿里巴巴16年大数据建设方法论,支持多种大数据引擎和AI计算服务,助力“Data+AI”全生命周期管理。开通DataWorks后即可免费体验DataWorks Copilot。
|
7月前
|
SQL 人工智能 自然语言处理
DataWorks年度发布:智能化湖仓一体数据开发与治理平台的演进
阿里云在过去15年中持续为268集团提供数据服务,积累了丰富的实践经验,并连续三年在IDC中国数据治理市场份额中排名第一。新一代智能数据开发平台DateWorks推出了全新的DateStudio IDE,支持湖仓一体化开发,新增Flink计算引擎和全面适配locs,优化工作流程系统和数据目录管理。同时,阿里云正式推出个人开发环境模式和个人Notebook,提升开发者体验和效率。此外,DateWorks Copilot通过自然语言生成SQL、代码补全等功能,显著提升了数据开发与分析的效率,已累计帮助开发者生成超过3200万行代码。
|
7月前
|
人工智能 Cloud Native 大数据
DataWorks深度技术解读:构建开放的云原生数据开发平台
Dateworks是一款阿里云推出的云原生数据处理产品,旨在解决数据治理和数仓管理中的挑战。它强调数据的准确性与一致性,确保商业决策的有效性。然而,严格的治理模式限制了开发者的灵活性,尤其是在面对多模态数据和AI应用时。为应对这些挑战,Dateworks进行了重大革新,包括云原生化、开放性增强及面向开发者的改进。通过Kubernetes作为资源底座,Dateworks实现了更灵活的任务调度和容器化支持,连接更多云产品,并提供开源Flowspec和Open API,提升用户体验。
|
7月前
|
SQL 分布式计算 DataWorks
DataWorks智能交互式数据开发与分析之旅
本次实验将带您进行DataWorks Notebook的快速入门,包含:Notebook新建、多引擎SQL开发与分析、Python开发、交互式分析等,同时,使用DataWorks Copilot体验智能数据开发,体验智能交互式数据探索之旅。
2791 11
|
7月前
|
SQL 数据采集 DataWorks
基于DataWorks的多场景实践及数据开发Data Studio最新体验测评
DataWorks是阿里云推出的一站式智能大数据开发治理平台,自2009年发布以来,历经多次迭代,成为企业数字化转型的重要工具。本文通过多个实践案例,如公共电影票房数据预处理,展示了DataWorks如何帮助企业高效处理大数据,涵盖数据集成、ETL开发、数据分析及治理等全流程。最新版DataWorks引入了智能助手Copilot,进一步提升了用户体验和工作效率。
|
7月前
|
DataWorks 搜索推荐 大数据
聊聊DataWorks——这个一站式智能大数据开发治理平台
聊聊DataWorks——这个一站式智能大数据开发治理平台
557 2
|
8月前
|
SQL 人工智能 DataWorks
DataWorks:新一代 Data+AI 数据开发与数据治理平台演进
本文介绍了阿里云 DataWorks 在 DA 数智大会 2024 上的最新进展,包括新一代智能数据开发平台 DataWorks Data Studio、全新升级的 DataWorks Copilot 智能助手、数据资产治理、全面云原生转型以及更开放的开发者体验。这些更新旨在提升数据开发和治理的效率,助力企业实现数据价值最大化和智能化转型。
1991 7

热门文章

最新文章

相关产品

  • 大数据开发治理平台 DataWorks