下半年你关心的行业热点都在这里,BIGDATA+AI Meetup 2020第二站·上海站开启报名!-阿里云开发者社区

开发者社区> Apache Spark中国社区> 正文

下半年你关心的行业热点都在这里,BIGDATA+AI Meetup 2020第二站·上海站开启报名!

简介: 本次活动汇集2020年下半年开发者最关心的开源主题,搜罗了数据湖、数仓架构、实时计算等热门议题,9位行业资深专家,硬核输出,用实践说话。

金秋桂花香,正是上海相聚好时节。还记得盛夏降临时我们举办的大数据+AI Meetup第一站吗,虽然疫情当前采用了线上直播的形式,但是我们仍然邀请了来自阿里巴巴、Databricks、快手、网易云音乐的7位技术专家,在北京、上海、杭州3地,集中解读上半年大数据的热门话题。时隔4个月,大数据江湖又有哪些风起云涌的技术突破,互联网大厂又探索出怎样的无价经验,敬请期待由阿里云计算平台事业部与阿里云开发者社区联合主办的大数据+AI meetup 2020第二站·上海线上线下,各有千秋,会场名额有限,报名抢入场券:http://hdxu.cn/1q8ZL

Meetup+AI_S02_KV16_9 1920*1080@1x.png

本次活动汇集2020年下半年开发者最关心的开源主题Flink,Pravega,Spark等,搜罗了数据湖、数仓架构、实时计算等热门议题,9位行业资深专家,硬核输出,用实践说话。2020年11月1日 10:00-18:00,来杨浦区政学路77号73coffee(IPO Club店) ,接受不间断的知识冲击,面基各厂领域大佬,我们安排了你想知道的和必须知道的,也安排了跟上节奏就能获得的惊喜社区周边礼物。

2 周边展示2.png

议题亮点

9个议题无不凸显宇宙真理:开源届前浪后浪全员凶猛,合体也成为主流。我们将会一睹Flink和Iceberg,Flink和 Hologres,Flink和Pulsar 的深度融合的火花、Spark高性能向量化查询引擎解析、热度冲天的数据湖存储架构选型、bilibili 和滴滴的kafka平台优化方案;还有Elasticsearch、开源流式存储系统 Pravega 的实践探索也不容错过。

议程 544*1920@2x.png

议题摘要

(更多议题详情请关注后续文章)

更低延时和更高吞吐量的流存储, Pravega性能详解

嘉宾:雷璐
DellEMC, Senior Principal Engineer, 在分布式对象存储和流存储产品上有着10年+设计架构经验。现主要专注于流式系统上数据全文检索方向-Pravega Search.

演讲简介:

选取流系统几个标准场景去比较Pravega, Kafka, and Pulsar性能,并且会公开所有技术细节


基于spark的高性能向量化查询引擎基于spark的高性能向量化查询引擎

嘉宾:范文臣
Databricks 开源组技术主管,Apache Spark Committer、PMC成员,Spark开源社区核心开发之一。

演讲简介:
本次演讲将向大家分享Databricks在构建向量化查询引擎过程中的一些实践经验。


数据湖存储架构选型

嘉宾:郑锴
花名铁杰,阿里巴巴高级技术专家,Apache Hadoop PMC。专注于在阿里云上研发业界领先的 Hadoop/Spark 大数据平台和数据湖解决方案产品。

演讲简介:

着重讨论数据湖架构和应用在存储上面临的主要挑战,方案选型和最佳实践。


Flink + Hologres 云原生实时数仓最佳实践

嘉宾:刘一鸣
花名合一, 阿里云高级产品专家,主要负责Hologres产品的演进和商业化。Apache Kylin PMC & Committer。

演讲简介:

分享Hologres设计理念和架构体系,解析大数据如何支持分析服务一体化,分享实时数仓建设实践案例。


Iceberg+Flink 应用场景深度分析

嘉宾:李劲松
花名之信,阿里巴巴技术专家,Apache Flink&Iceberg Committer,长期专注于流批一体的计算与数仓架构。

演讲简介

1.Iceberg及数据湖介绍

2.构建数仓Data Pipeline

3.数仓实时化流批统一,Backfilling: 流作业Bootstrap

4.构建CDC Pipeline


万亿级消息队列Kafka在滴滴的实践

嘉宾:张亮
滴滴大数据架构部,高级技术专家, 2014年加入滴滴,具有丰富的高并发、高吞吐场景的架构设计与研发经验。

演讲简介:

分享滴滴在Kafka高可用建设上在架构与引擎上的针对性优化;在Kafka可观察性与运维友好性上在Kafka云平台的建设实践。


Kafka practice at bilibili

嘉宾:张辰安
bilibili 资深开发工程师

演讲简介:

介绍在大流量下kafka的痛点及解决方案


Apache Pulsar + Flink:统一批流处理最佳实践

嘉宾:赵建云
StreamNative 工程师,Apache Pulsar Contributor

演讲简介:

介绍批流融合带来的新特性,例如并行批处理读取使用批处理工作负载、Key_Shared订阅等,分享批流融合处理的最佳实践案例。


Elasticsearch 大数据应用能力探查

嘉宾:​李猛
​上海力萌信息科技有限公司,数据技术专家。

演讲简介:

1.全面介绍Elastic Stack自有大数据的处理能力、应用场景案例。
2.了解Elasticsearch与其它大数据产品混合能力、应用场景案例。


线上同样精彩,本次会议仍然保留直播,为不能到现场的同学同步精彩分享,速来预约直播,不错过当日推送。
直播间地址:https://developer.aliyun.com/live/245461

免费报名抢入场券http://hdxu.cn/1q8ZL


行程小助手

  • 73coffee位于上海地铁10号线江湾体育场地铁站,10号口步行604米处。
  • 前楼有地下停车场10元/小时

了解更多信息请加入大数据+AI钉钉群
大数据ai钉钉群.png

版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

分享:

阿里巴巴开源大数据技术团队成立Apache Spark中国技术社区,定期推送精彩案例,问答区数个Spark技术同学每日在线答疑,只为营造纯粹的Spark氛围,欢迎加入!邀请你加入钉钉群聊Apache Spark中国技术交流社区,点击进入查看详情 https://qr.dingtalk.com/action/joingroup?code=v1,k1,X7S/0/QcrLMkK7QZ5sw2oTvoYW49u0g5dvGu7PW+sm4=&_dt_no_comment=1&origin=11

官方博客
官网链接