【云栖大会】再谈开源大数据

简介: 本论坛第一次聚集阿里Hadoop、Spark、Hbase、Jtorm各领域的技术专家,讲述Hadoop生态的过去现在未来及阿里在Hadoop大生态领域的实践与探索。本论坛还发布了阿里云E-MapReduce交互式产品。
2016杭州云栖大会在云栖小镇召开,本届大会以“飞天・进化”为主题,内容规模比去年翻倍,从原本2天的议程增加至4天,从10月13日持续到16日,超过400场主题演讲使开发者们对阿里云计算生态发展和应用趋势、前沿技术和产品有了更深刻的了解。

阿里在09年就开始尝试使用Hadoop技术,先后包括Hadoop、Spark、Hbase及Jtorm,这些开源技术在不同的业务线广泛使用,推动阿里业务的发展。本论坛第一次聚集了阿里Hadoop、Spark、Hbase、Jtorm各领域的技术专家,讲述Hadoop生态的过去现在未来及阿里在Hadoop大生态领域的实践与探索。本论坛还发布了阿里云E-MapReduce交互式产品。

在2016杭州云栖大会第四天的“开源大数据技术专场”分会场上,范文臣、Intel 研发经理郑锴、逸晗网络科技大数据平台负责人杨智、 Intel技术专家毛玮、阿里云技术专家木艮围绕开源大数据技术为大家哦做了精彩的分享。


范文臣:Deep dive into catalyst
本次演讲范文臣从 Catalyst 的基本概念开始,深入讲解了 Catalyst 提供了哪些主要特性来支持 Spark 的 API 抽象。


郑锴:HDFS下一步新思考:在支持了纠删码之后
郑锴首先回顾了最近一两年Hadoop社区对HDFS 纠删码的支持,介绍EC对用户的价值,适用场景和部署建议。然后重点思考了Hadoop社区在HDFS上面接下来会怎么走,介绍当前在做的几个重要特性,探讨大数据存储的发展趋势,同时也希望跟用户有效互动得到更多反馈。


杨智:梨视频基于E-MapReduce大数据推荐系统 
内容包括逸晗网络科技的数据实时统计、数据处理平台、推荐实时反馈、推荐模型&排序机器学习模型训练和更新等。


毛玮:分布式流处理框架:功能对比及性能评估
毛玮从流处理的核心概念,到功能的完备性,全方位对比了目前比较热门的流处理框架:Spark Streaming, Flink,Storm和Gearpump。同时从吞吐量个延时两个方面,对各个平台进行了性能评估。


木艮:Hadoop存储与计算分离实践
为什么需要存储计算分离、分离后的性能怎么样,做了哪些优化,适应哪些场景?是木艮在本次演讲中告诉我们的内容。
相关实践学习
基于MaxCompute的热门话题分析
Apsara Clouder大数据专项技能认证配套课程:基于MaxCompute的热门话题分析
相关文章
|
4月前
|
人工智能 安全 架构师
开放、协同,2025 云栖大会“操作系统开源与 AI 进化分论坛”精彩回顾
唯有通过生态开放与技术共享,才能加速 AI 技术的普惠与产业化落地。
|
4月前
|
人工智能 运维 安全
|
4月前
|
人工智能 云栖大会
|
5月前
|
人工智能 云栖大会 Anolis
|
分布式计算 大数据 Serverless
云栖实录 | 开源大数据全面升级:Native 核心引擎、Serverless 化、湖仓架构引领云上大数据发展
在2024云栖大会开源大数据专场上,阿里云宣布推出实时计算Flink产品的新一代向量化流计算引擎Flash,该引擎100%兼容Apache Flink标准,性能提升5-10倍,助力企业降本增效。此外,EMR Serverless Spark产品启动商业化,提供全托管Serverless服务,性能提升300%,并支持弹性伸缩与按量付费。七猫免费小说也分享了其在云上数据仓库治理的成功实践。其次 Flink Forward Asia 2024 将于11月在上海举行,欢迎报名参加。
849 6
云栖实录 | 开源大数据全面升级:Native 核心引擎、Serverless 化、湖仓架构引领云上大数据发展
|
机器学习/深度学习 监控 大数据
Serverless 应用的监控与调试问题之Flink在整个开源大数据生态中应该如何定位,差异化该如何保持
Serverless 应用的监控与调试问题之Flink在整个开源大数据生态中应该如何定位,差异化该如何保持
|
数据可视化 大数据 定位技术
GIS:开源webgl大数据地图类库整理
GIS:开源webgl大数据地图类库整理
640 0

热门文章

最新文章