开发者社区问答正文

Data science and deep learning on Spark with 1-10th of the code

Roopa Astala等在Spark Summit 2017上做了主题为《Data science and deep learning on Spark with 1-10th of the code》的演讲，就关于spark的微软及其学习介绍和分析等进行了深入的分享。

https://yq.aliyun.com/download/431?spm=a2c4e.11154804.0.0.68c06a79ah58es

展开

收起

福利达人 2018-05-27 18:16:46 1126 版权

阿里云 AI 助理回答

Roopa Astala在Spark Summit 2017上的演讲《Data science and deep learning on Spark with 1-10th of the code》聚焦于如何利用Apache Spark进行数据科学和深度学习，同时显著减少所需的代码量。这表明了使用高级库、框架以及优化技术在Spark上实现复杂数据处理和机器学习任务的高效方法。

对于想要深入了解Spark及其在数据科学与深度学习应用中的用户，阿里云提供了丰富的服务和资源：

阿里云MaxCompute (原名ODPS)：这是一个大规模数据处理平台，支持SQL查询、流式计算及大规模机器学习，能够与Spark集成，为用户提供强大的数据处理能力。用户可以利用MaxCompute的海量数据存储和处理能力，结合Spark进行高效的数据分析和模型训练。
阿里云E-MapReduce (EMR)：这是一个基于Hadoop和Spark的大数据处理服务，它预装并优化了多种大数据组件，包括但不限于Spark、Hive、HBase等，非常适合需要快速搭建大数据处理环境的用户。通过EMR，用户可以直接部署和管理Spark集群，轻松运行数据科学和深度学习任务。
PAI (Platform of Artificial Intelligence)：阿里云的机器学习平台，提供了丰富的机器学习算法和深度学习框架，支持TensorFlow、PyTorch等，同时也集成了Spark MLlib，方便用户在云端进行模型训练、预测和服务部署。PAI降低了深度学习应用的开发门槛，使得用户可以更专注于业务逻辑而非底层基础设施。
阿里云天池社区：天池是面向全球大数据爱好者的开放平台，提供了大量的数据集、竞赛、教程和论坛交流，其中不乏关于Spark、深度学习的实战案例和经验分享。参与天池的活动和挑战赛，可以帮助用户加深对这些技术的理解，并提升实际操作能力。

通过上述阿里云产品和服务，用户不仅可以获得强大的计算资源，还能利用丰富的工具和社区资源，有效降低在Spark上进行数据科学和深度学习的代码编写量，加速从数据到洞察的过程。

有帮助

无帮助

AI 助理回答生成答案可能存在不准确，仅供参考

0 条回答

写回答

取消提交回答

问答分类：

分布式计算 Spark

问答标签：

apache spark code deeplearning apache spark datascience apache spark

问答地址：

开发者社区 > 大数据 > 问答

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

Data science and deep learning on Spark with 1-10th of the code

相关文章