回顾 | SPARK + AI SUMMIT 2020 中文精华版线上峰会圆满结束(附PPT下载)

简介: 超乎你想象的干货合集打包带走!

7月4日~7月5日,2020 年首场 SPARK + AI SUMMIT 2020 中文精华版线上峰会圆满结束。本次活动精选北美summit优质内容,由 Apache Spark 核心贡献者们在原版英文 talk 的基础上进行翻译及解说。

点击链接免费下载完整峰会PPT资料:

https://developer.aliyun.com/topic/download?id=715

大会亮点:

  • 十五位巨星级中文解说嘉宾
  • 国际知名厂商最新应用案例
  • Apache Spark 3.0最新成果及未来动向
  • 首届Spark+AI医疗诊断比赛独家探秘

除 Databricks、Facebook、阿里巴巴、Intel 、领英等一线厂商的经典应用场景外,还有Ray、SQL、Structured Streaming、 MLflow、Koalas、K8s、Delta lake 等新奇议题及社区生态的最新落地。

Meetup 议题回顾:

SPARK + AI SUMMIT 2020 中文精华版线上峰会—7月4日上午议题
SPARK中文峰会上海会场预告篇|Ray On Spark
SPARK + AI SUMMIT 2020 中文精华版线上峰会—7月5日议题


关注Apache Spark技术交流社区微信公众号,获取更多技术干货
image.png

回看直播!👇

7月4日直播
7月5日直播

相关文章
|
5月前
|
人工智能 运维 Cloud Native
2025 云栖精选资料:《从云原生到 AI 原生核心技术与最佳实践》PPT 免费下载
一本合集,四大主题,覆盖 AI 原生技术的核心版图。立即获取,与行业领跑者同行,抢占 AI 原生时代的技术先机!
|
11月前
|
人工智能 Cloud Native Serverless
从理论到落地:MCP 实战解锁 AI 应用架构新范式
本文旨在从 MCP 的技术原理、降低 MCP Server 构建复杂度、提升 Server 运行稳定性等方面出发,分享我们的一些实践心得。
4512 102
|
9月前
|
人工智能 自然语言处理 搜索推荐
Spark-TTS: AI语音合成的"变声大师"
Spark-TTS 是一款革命性的语音合成模型,被誉为“变声大师”。它通过创新的 BiCodec 技术将语音分解为语义和全局两种 Token,实现对音色、性别、语速等属性的精细控制。结合统一的 LLM 架构,Spark-TTS 简化了传统 TTS 的复杂流程,同时提供了前所未有的灵活性。此外,团队还发布了 VoxBox 开源数据集,为行业提供标准评估基准。尽管在零样本场景下仍存改进空间,但 Spark-TTS 已经开启了语音合成新时代,让个性化、可控的 AI 语音成为可能。
961 5
|
人工智能 分布式计算 调度
打破资源边界、告别资源浪费:ACK One 多集群Spark和AI作业调度
ACK One多集群Spark作业调度,可以帮助您在不影响集群中正在运行的在线业务的前提下,打破资源边界,根据各集群实际剩余资源来进行调度,最大化您多集群中闲置资源的利用率。
|
人工智能 数据可视化 定位技术
AI 小技巧 | PPT 也能用数据地图?
AI 小技巧 | PPT 也能用数据地图?
603 4
|
12月前
|
人工智能 搜索推荐 算法
当AI代做PPT时,教师如何完成自我迭代?——从生成式人工智能(GAI)认证看教育者的未来突围
本文探讨了AI在教育领域的广泛应用及其对教师角色的挑战,强调知识观与教育观的转变。生成式人工智能(GAI)认证为教师提供了提升AI应用能力、促进教育创新的机会。文章建议教师通过转变观念、加强情感交流及参与创新实践完成自我迭代,并呼吁政府、学校和社会共同支持AI时代教育的发展,以培养适应未来的高素质人才。
|
人工智能 开发者
AI Forward: Alibaba Cloud Developer Summit 2025 开放注册中
AI Forward: Alibaba Cloud Developer Summit 2025 开放注册中
|
人工智能 Go 开发者
倒计时1天!这里查收AI Forward: Alibaba Cloud Developer Summit 2025大会议程
倒计时1天!这里查收AI Forward: Alibaba Cloud Developer Summit 2025大会议程
|
9月前
|
人工智能 分布式计算 大数据
大数据≠大样本:基于Spark的特征降维实战(提升10倍训练效率)
本文探讨了大数据场景下降维的核心问题与解决方案,重点分析了“维度灾难”对模型性能的影响及特征冗余的陷阱。通过数学证明与实际案例,揭示高维空间中样本稀疏性问题,并提出基于Spark的分布式降维技术选型与优化策略。文章详细展示了PCA在亿级用户画像中的应用,包括数据准备、核心实现与效果评估,同时深入探讨了协方差矩阵计算与特征值分解的并行优化方法。此外,还介绍了动态维度调整、非线性特征处理及降维与其他AI技术的协同效应,为生产环境提供了最佳实践指南。最终总结出降维的本质与工程实践原则,展望未来发展方向。
456 0