下半年你关心的行业热点都在这里,BIGDATA+AI Meetup 2020第二站·上海站开启报名!

简介: 本次活动汇集2020年下半年开发者最关心的开源主题,搜罗了数据湖、数仓架构、实时计算等热门议题,9位行业资深专家,硬核输出,用实践说话。

金秋桂花香,正是上海相聚好时节。还记得盛夏降临时我们举办的大数据+AI Meetup第一站吗,虽然疫情当前采用了线上直播的形式,但是我们仍然邀请了来自阿里巴巴、Databricks、快手、网易云音乐的7位技术专家,在北京、上海、杭州3地,集中解读上半年大数据的热门话题。时隔4个月,大数据江湖又有哪些风起云涌的技术突破,互联网大厂又探索出怎样的无价经验,敬请期待由阿里云计算平台事业部与阿里云开发者社区联合主办的大数据+AI meetup 2020第二站·上海线上线下,各有千秋,会场名额有限,报名抢入场券:http://hdxu.cn/1q8ZL

Meetup+AI_S02_KV16_9 1920*1080@1x.png

本次活动汇集2020年下半年开发者最关心的开源主题Flink,Pravega,Spark等,搜罗了数据湖、数仓架构、实时计算等热门议题,9位行业资深专家,硬核输出,用实践说话。2020年11月1日 10:00-18:00,来杨浦区政学路77号73coffee(IPO Club店) ,接受不间断的知识冲击,面基各厂领域大佬,我们安排了你想知道的和必须知道的,也安排了跟上节奏就能获得的惊喜社区周边礼物。

2 周边展示2.png

议题亮点

9个议题无不凸显宇宙真理:开源届前浪后浪全员凶猛,合体也成为主流。我们将会一睹Flink和Iceberg,Flink和 Hologres,Flink和Pulsar 的深度融合的火花、Spark高性能向量化查询引擎解析、热度冲天的数据湖存储架构选型、bilibili 和滴滴的kafka平台优化方案;还有Elasticsearch、开源流式存储系统 Pravega 的实践探索也不容错过。

议程 544*1920@2x.png

议题摘要

(更多议题详情请关注后续文章)

更低延时和更高吞吐量的流存储, Pravega性能详解

嘉宾:雷璐
DellEMC, Senior Principal Engineer, 在分布式对象存储和流存储产品上有着10年+设计架构经验。现主要专注于流式系统上数据全文检索方向-Pravega Search.

演讲简介:

选取流系统几个标准场景去比较Pravega, Kafka, and Pulsar性能,并且会公开所有技术细节


基于spark的高性能向量化查询引擎基于spark的高性能向量化查询引擎

嘉宾:范文臣
Databricks 开源组技术主管,Apache Spark Committer、PMC成员,Spark开源社区核心开发之一。

演讲简介:
本次演讲将向大家分享Databricks在构建向量化查询引擎过程中的一些实践经验。


数据湖存储架构选型

嘉宾:郑锴
花名铁杰,阿里巴巴高级技术专家,Apache Hadoop PMC。专注于在阿里云上研发业界领先的 Hadoop/Spark 大数据平台和数据湖解决方案产品。

演讲简介:

着重讨论数据湖架构和应用在存储上面临的主要挑战,方案选型和最佳实践。


Flink + Hologres 云原生实时数仓最佳实践

嘉宾:刘一鸣
花名合一, 阿里云高级产品专家,主要负责Hologres产品的演进和商业化。Apache Kylin PMC & Committer。

演讲简介:

分享Hologres设计理念和架构体系,解析大数据如何支持分析服务一体化,分享实时数仓建设实践案例。


Iceberg+Flink 应用场景深度分析

嘉宾:李劲松
花名之信,阿里巴巴技术专家,Apache Flink&Iceberg Committer,长期专注于流批一体的计算与数仓架构。

演讲简介

1.Iceberg及数据湖介绍

2.构建数仓Data Pipeline

3.数仓实时化流批统一,Backfilling: 流作业Bootstrap

4.构建CDC Pipeline


万亿级消息队列Kafka在滴滴的实践

嘉宾:张亮
滴滴大数据架构部,高级技术专家, 2014年加入滴滴,具有丰富的高并发、高吞吐场景的架构设计与研发经验。

演讲简介:

分享滴滴在Kafka高可用建设上在架构与引擎上的针对性优化;在Kafka可观察性与运维友好性上在Kafka云平台的建设实践。


Kafka practice at bilibili

嘉宾:张辰安
bilibili 资深开发工程师

演讲简介:

介绍在大流量下kafka的痛点及解决方案


Apache Pulsar + Flink:统一批流处理最佳实践

嘉宾:赵建云
StreamNative 工程师,Apache Pulsar Contributor

演讲简介:

介绍批流融合带来的新特性,例如并行批处理读取使用批处理工作负载、Key_Shared订阅等,分享批流融合处理的最佳实践案例。


Elasticsearch 大数据应用能力探查

嘉宾:​李猛
​上海力萌信息科技有限公司,数据技术专家。

演讲简介:

1.全面介绍Elastic Stack自有大数据的处理能力、应用场景案例。
2.了解Elasticsearch与其它大数据产品混合能力、应用场景案例。


线上同样精彩,本次会议仍然保留直播,为不能到现场的同学同步精彩分享,速来预约直播,不错过当日推送。
直播间地址:https://developer.aliyun.com/live/245461

免费报名抢入场券http://hdxu.cn/1q8ZL


行程小助手

  • 73coffee位于上海地铁10号线江湾体育场地铁站,10号口步行604米处。
  • 前楼有地下停车场10元/小时

了解更多信息请加入大数据+AI钉钉群
大数据ai钉钉群.png

相关文章
|
3月前
|
安全 Java 数据库连接
【反射】Java反射 全方位知识体系(附 应用场景 + 《八股文常考面试题》)
Java反射是运行时动态获取类元信息(构造器、方法、字段等)并操作对象的能力,核心为 Class对象。广泛应用于Spring、MyBatis等框架的IoC、AOP、ORM映射,以及注解处理、动态代理、SPI扩展等场景,兼具灵活性与解耦优势,但存在性能开销和安全风险。
445 10
|
3月前
|
存储 新零售 人工智能
【云故事探索】 NO.21 | 良品铺子:70TB 核心数据“闪电”上云,重塑零食帝国的数字底座
本期,我们走进零售行业领军者——良品铺子,聆听他们如何将运行十年的核心系统搬上云端,打造更智能的“零食帝国”。
|
7月前
|
人工智能 安全 API
FastMCP 入门:用 Python 快速搭建 MCP 服务器接入 LLM
MCP协议为大语言模型连接外部工具与数据提供标准化方案,FastMCP是其Python最佳实践框架。本文详解MCP核心概念,演示如何用FastMCP快速搭建支持工具调用、资源访问与身份认证的MCP服务器,并集成至LLM应用,实现AI智能体与真实世界的高效交互。
2602 2
FastMCP 入门:用 Python 快速搭建 MCP 服务器接入 LLM
|
9月前
|
存储 人工智能 搜索推荐
Mem0 + Milvus:为人工智能构建持久化长时记忆
Mem0 为AI打造持久记忆层,结合Milvus向量数据库,让智能体记住用户偏好、追溯历史对话,实现个性化持续交互,告别“健忘”AI。
Mem0 + Milvus:为人工智能构建持久化长时记忆
|
10月前
|
人工智能 前端开发 JavaScript
别让“忽略”变成技术债,解锁排查思路
本文系统分析了前端开发中各类警告(Warning)的处理策略,涵盖评估模型、安全改造方法、高效解决技巧及自动化管理方案,旨在提升代码质量与团队协作效率。
259 0
|
存储 NoSQL Java
流计算需要框架吗?SPL 可能是更好的选择
流数据源的动态无界特性使得传统数据库技术难以直接处理,而Heron、Samza、Storm、Spark、Flink等计算框架在流计算领域取得了先发优势。然而,这些框架往往侧重于访问能力,计算能力不足,尤其在高级计算如流批混算、复杂计算和高性能计算方面表现欠佳。esProc SPL作为基于JVM的轻量级开源计算类库,专注于提升流计算的计算能力,支持丰富的流数据访问、灵活的集成接口和高效的内外存存储格式,具备强大的高级计算功能,能够简化业务逻辑开发并适应多样的应用场景。SPL通过专业的计算语言和结构化数据处理能力,为流计算提供了更优的解决方案。
|
网络协议
TCP连接释放过程
【8月更文挑战第20天】
1362 3
个人域名备案的流程是什么样的?
【10月更文挑战第10天】个人域名备案的流程是什么样的?
2652 0
|
消息中间件 设计模式 监控
Android性能优化 | 大图做帧动画卡?优化帧动画之 SurfaceView滑动窗口式帧复用
继上篇用“SurfaceView逐帧解析&帧复用”优化了帧动画内存性能后,一个更复杂的问题浮出水面:帧动画时间性能。这一篇试着让每帧素材大小 1MB 的帧动画流畅播放的同时不让内存膨胀。
1286 0
|
存储 XML 安全
GTK入门
GTK入门
764 0