Apache Spark & Paimon Meetup · 北京站,助力 LakeHouse 架构生产落地

简介: 2024年11月15日13:30北京市朝阳区阿里中心-望京A座-05F,阿里云 EMR 技术团队联合 Apache Paimon 社区举办 Apache Spark & Paimon meetup,助力企业 LakeHouse 架构生产落地”线下 meetup,欢迎报名参加!

众所周知,LakeHouse 架构是当前大数据领域领先的技术架构之一。LakeHouse 由海外知名大数据公司 Databricks 提出,旨在融合数据湖的灵活性及成本效益与传统数据仓库的强大事务支持、高性能分析能力于一体,并且能够无缝集成机器学习等多种应用场景,为企业提供了更加全面的数据管理和分析平台。


Apache Spark 作为近十几年来大数据领域最优秀的开源项目之一,提供了强大统一的大数据处理和分析能力,涵盖了实时离线数据处理、SQL、图计算、机器学习及深度学习等多个维度,作为 LakeHouse 的核心组件,Spark 在大数据和AI方向持续发力。


Apache Paimon 作为新兴的数据湖存储技术,最初在Flink社区中以 Flink Table Store项目孵化。2023 年,Paimon独立出来成为一个 Apache Incubator项目,2024 年 4 月完成孵化成为了一个Apache顶级项目。Apache Paimon 采用开放的数据格式和技术理念,提供高吞吐、低延迟的数据摄入、更新及查询能力,且与诸多业界主流计算对接,是 LakeHouse 架构中不可或缺的一部分。


为了助力 LakeHouse 架构在企业中的实践与落地,阿里云 EMR 技术团队联合 Apache Paimon 社区,联合举办Apache Spark & Paimon, 助力 LakeHouse 架构生产落地”线下 meetup,邀请阿里云、VIVO、美团等众多业内大咖分享 LakeHouse 架构的核心技术和最佳实践经验,为大数据从业者提供一个开放的分享与交流平台。


活动详情

  • 活动时间:2024年11月15日 13:30-17:30(周五)
  • 活动地点:北京市朝阳区阿里中心-望京A座-05F


立即报名>>



活动亮点

1. 业内大咖云集

本次 Meetup 特邀阿里云、VIVO、美团等知名企业的技术专家现场分享,将为大家带来最前沿的技术洞察和实践经验,分享他们在 LakeHouse 架构实施过程中遇到的挑战与解决方案。


2. 深入探讨 LakeHouse 架构

LakeHouse 架构作为一种新兴的大数据存储与处理架构,融合了数据湖和数据仓库的优势。本次活动将深入探讨LakeHouse 架构的核心技术,包括数据采集、数据存储、数据分析、数据管理等多个方面,帮助企业更好地理解和应用这一创新架构。


3. Apache Spark 与 Paimon 的深度整合

Apache Spark 作为大数据处理的利器,与 Paimon 的深度整合将带来更加强大的数据处理能力。本次 Meetup 将详细介绍 Spark 与 Paimon 的集成实践,分享在具体项目中的应用案例,展示其在提升数据处理效率方面的卓越表现。


4. 最佳实践与成功案例分享

除了技术的探讨,本次 Meetup 还将分享多个企业在 LakeHouse 架构实践中的成功案例。通过这些最佳实践,您将了解到不同企业在不同场景下的应用经验,找到适合自己企业的解决方案,从而推动业务的创新与发展。


期待您的参与

无论您是大数据技术爱好者,还是企业技术决策者,都能通过本次活动找到有价值的信息与灵感。我们期待与您在活动现场相见,共同开启 LakeHouse 架构的探索之旅!


EMR Serverless Spark 版是开源大数据平台 E-MapReduce 基于 Spark 提供的一款全托管、一站式的数据计算平台,它为用户提供任务开发、调试、发布、调度和运维等全方位的产品化服务。EMR Serverless Spark 完全兼容 Paimon,通过内置的 DLF 的元数据实现了和其余阿里云产品如实时计算 Flink 版的元数据互通,形成了完整的流批一体的解决方案。同时支持灵活的作业运行方式和参数配置,能够满足实时分析、生产调度等多项需求。阿里云 EMR Serverless Spark 版已于2024年9月14日正式商业化售卖,欢迎体验!

bb0c699fa6bfbaf79a19ec7e60f9bcb3.jpg

相关实践学习
基于MaxCompute的热门话题分析
Apsara Clouder大数据专项技能认证配套课程:基于MaxCompute的热门话题分析
目录
相关文章
|
8月前
|
存储 消息中间件 Kafka
Confluent 首席架构师万字剖析 Apache Fluss(二):核心架构
原文:https://jack-vanlightly.com/blog/2025/9/2/understanding-apache-fluss 作者:Jack Vanlightly 翻译:Wayne Wang@腾讯 译注:Jack Vanlightly 是一位专注于数据系统底层架构的知名技术博主,他的文章以篇幅长、细节丰富而闻名。目前 Jack 就职于 Confluent,担任首席技术架构师,因此这篇 Fluss 深度分析文章,具备一定的客观参考意义。译文拆成了三篇文章,本文是第二篇。
890 20
|
8月前
|
Dubbo Java 应用服务中间件
Apache ShenYu 架构学习指南
Apache ShenYu 是一款高性能、插件化的微服务API网关,基于Spring WebFlux + Reactor 构建,支持多协议、动态配置与实时数据同步。本指南以通俗类比和实战路径,带你深入理解其架构设计、核心流程与源码实现,助力快速掌握并参与贡献。
1290 12
|
8月前
|
分布式计算 Kubernetes 调度
Kubeflow-Spark-Operator-架构学习指南
本指南系统解析 Spark Operator 架构,涵盖 Kubebuilder 开发、控制器设计与云原生集成。通过四阶段学习路径,助你从部署到贡献,掌握 Kubernetes Operator 核心原理与实战技能。
490 0
|
9月前
|
消息中间件 缓存 JavaScript
如何开发ERP(离散制造-MTO)系统中的生产管理板块(附架构图+流程图+代码参考)
本文详解离散制造MTO模式下的ERP生产管理模块,涵盖核心问题、系统架构、关键流程、开发技巧及数据库设计,助力企业打通计划与执行“最后一公里”,提升交付率、降低库存与浪费。
SQL 关系型数据库 MySQL
656 0
|
10月前
|
存储 分布式计算 Apache
湖仓一体:小米集团基于 Apache Doris + Apache Paimon 实现 6 倍性能飞跃
小米通过将 Apache Doris(数据库)与 Apache Paimon(数据湖)深度融合,不仅解决了数据湖分析的性能瓶颈,更实现了 “1+1>2” 的协同效应。在这些实践下,小米在湖仓数据分析场景下获得了可观的业务收益。
1562 9
湖仓一体:小米集团基于 Apache Doris + Apache Paimon 实现 6 倍性能飞跃
|
11月前
|
自然语言处理 监控 供应链
如何开发供应商管理系统中的外协生产板块(附架构图+流程图+代码参考)
本文详细介绍了供应商管理系统中外协生产板块的构建与开发,涵盖功能设计、业务流程、开发技巧及优化策略,助力企业提升外协生产的管理效率与质量控制能力。
|
11月前
|
前端开发 Java 关系型数据库
如何开发一套生产小工单(附架构图+流程图+代码参考)
生产小工单是制造企业精细化管理的重要工具,用于管理特定生产环节的小范围任务,如检验、调试、安装等。相比大规模生产任务,它更细致、灵活,能提升信息透明度与执行效率。本文详解如何开发一套高效的小工工单系统,涵盖功能设计、技术选型、业务流程及实现效果,并提供代码示例与架构方案,助力企业实现智能化、信息化生产管理。
|
11月前
|
前端开发 JavaScript 关系型数据库
如何开发生产小工单中的产品管理板块(附架构图+流程图+代码参考)
生产小工单中的产品管理板块是制造业数字化管理的关键环节,涵盖产品信息、生产工序、产品列表和基础设置四大功能模块。通过系统化管理,企业可实现对产品属性、工艺流程及资源配置的精准控制,提升生产效率并减少误差与浪费。本文详解了各功能模块的设计逻辑、业务流程及开发实现方案,并提供示例代码,助力企业构建高效、灵活的产品管理系统。
|
11月前
|
数据采集 监控 前端开发
如何开发生产小工单中的数字化看板(附架构图+流程图+代码参考)
本文介绍了如何通过数字化看板优化生产小工单管理。内容涵盖生产小工单的概念、数字化看板的功能模块(如生产监控、执行统计、数据统计、员工工资统计)、业务流程设计、技术架构与开发技巧,并提供代码示例,助力企业实现高效、可视化的生产管理。

推荐镜像

更多