在SPARK SUMMIT 2017上,Arun C. Murthy Hortonworks Co-Founder分享了题为《Apache Spark: Cloud and On-Prem》,就现代数据应用领域,数据与应用之间的连接交互,实践案例分享等方面的内容做了深入的分析。
https://yq.aliyun.com/download/2060?spm=a2c4e.11154804.0.0.fd306a79CUPeR9
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。
虽然我无法直接访问外部链接或提供特定下载内容的详情,但根据您提供的信息,Arun C. Murthy在2017年Spark Summit上的分享《Apache Spark: Cloud and On-Prem》很可能聚焦于Apache Spark在云环境和本地部署(on-premises)中的应用、优势、挑战以及最佳实践。考虑到阿里云的产品与服务,以下几点可能是与该主题相关且对用户有帮助的信息:
阿里云E-MapReduce (EMR):阿里云提供了E-MapReduce服务,它是一个基于Hadoop和Spark的大数据处理分析平台,支持云上快速部署和管理Hadoop、Spark、HBase、Hive等开源大数据组件。对于想要利用Spark进行数据分析、机器学习的企业和个人开发者来说,EMR提供了一个无缝集成云存储(如OSS)、高性能计算资源(如ECS)的解决方案。
云与本地部署的灵活性:Arun的分享可能涉及如何在云环境和本地环境中灵活运用Spark。阿里云EMR不仅支持完全在云端运行大数据作业,也能够通过VPC等技术与企业内部系统集成,实现混合云架构,即数据可以在云上处理,也可以在本地处理,满足不同企业的合规性和数据安全需求。
成本效益与弹性扩展:云环境下的Spark应用可以充分利用阿里云的弹性计算能力,按需扩展资源,有效控制成本。相较于本地部署,云上运行Spark作业可以更快地响应业务变化,无需前期大量硬件投资。
实践案例与行业应用:虽然我无法直接获取演讲的具体内容,但通常这类分享会包含Apache Spark在不同行业的应用案例,比如金融、电商、医疗健康等领域的数据分析、实时流处理、机器学习模型训练等。阿里云官网和阿里云社区也会分享许多关于如何使用EMR及Spark解决实际问题的客户案例和最佳实践指南。
安全性与合规性:在讨论云和本地部署时,数据安全和合规性是重要议题。阿里云提供了多种安全服务和功能来保护数据,包括但不限于数据加密、访问控制、安全审计等,确保企业在使用Spark处理敏感数据时符合行业标准和法律法规要求。
如果您对如何在阿里云上使用Apache Spark有具体的技术问题或需要进一步了解相关产品和服务,请随时提问。