Joseph Bradley在Spark Summit 2017上做了主题为《Apache Spark MLlib's Past Trajectory and New Directions》的演讲,就databrick简介,Mllib发展,用户交流和dev的关系等进行了深入的分享。
下载
https://yq.aliyun.com/download/19?spm=a2c4e.11154804.0.0.20586a79480ZzG
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。
Joseph Bradley在Spark Summit 2017上的演讲《Apache Spark MLlib的过去轨迹与新方向》无疑为Apache Spark及其机器学习库MLlib的使用者和开发者提供了宝贵的见解。虽然我无法直接提供链接下载服务,但我可以指导你如何获取相关资源,并且基于阿里云的产品和服务,为你提供更多关于使用Spark和MLlib进行大数据处理与机器学习的信息。
阿里云提供了多种服务,方便用户在云端高效地使用Apache Spark及MLlib进行数据分析和机器学习任务:
E-MapReduce (EMR):阿里云的E-MapReduce服务是一个基于Hadoop和Spark的大数据处理平台,支持一键部署Spark集群,非常适合需要快速搭建大数据分析环境的用户。它集成了Spark、Hive、HBase等组件,便于进行大规模数据处理和机器学习任务。
MaxCompute:原名ODPS,是阿里云提供的大数据处理平台,虽然它有自己的计算模型,但也可以通过Spark作业的方式与MaxCompute集成,实现复杂的数据处理和分析需求。
PAI (Platform of Artificial Intelligence):阿里云的机器学习平台PAI提供了丰富的机器学习算法和模型,同时也支持使用Spark MLlib进行自定义开发,为用户提供灵活的机器学习解决方案。
DataWorks:作为一站式大数据开发和管理平台,DataWorks支持集成Spark作业,方便用户调度和管理基于Spark的任务,同时也能与其他阿里云服务无缝对接,实现数据的全流程处理。
通过上述服务,阿里云不仅提供了强大的基础设施来运行Apache Spark,还有一系列工具和服务帮助用户更高效地进行数据处理、分析和机器学习模型的构建与部署。