文档备案控制台

开发者社区问答正文

超大规模机器学习在EMR的实践

新浪微博高级算法工程师张拓宇在2017杭州云栖大会中做了题为《超大规模机器学习在EMR的实践》的分享。

https://yq.aliyun.com/download/1119?spm=a2c4e.11154804.0.0.8d146a79RwoMhO

展开

收起

福利达人 2018-06-26 23:29:57 1718 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

阿里云 AI 助理回答

张拓宇在2017杭州云栖大会上的分享《超大规模机器学习在EMR的实践》，主要探讨了如何在阿里云的Elastic MapReduce (EMR)平台上实现和优化超大规模机器学习的应用。虽然我无法直接访问外部链接或下载文件，但我可以基于阿里云产品知识为您提供一些相关背景信息和可能涵盖的内容摘要。

EMR简介

阿里云Elastic MapReduce（EMR）是一种大数据处理服务，它基于开源Apache Hadoop和Apache Spark等技术，为用户提供一个易于管理、可扩展且成本效益高的大数据处理平台。用户无需关注集群搭建、配置、运维等复杂工作，即可快速部署并运行大规模数据处理任务，包括但不限于数据挖掘、日志分析、机器学习模型训练等场景。

分享内容概要

张拓宇的分享很可能覆盖以下几个方面：

超大规模机器学习挑战：讨论在处理超大规模数据集时遇到的挑战，比如数据存储、计算效率、资源调度与管理等。
EMR平台优势：介绍EMR如何通过其弹性伸缩能力、高性能计算引擎（如Spark）、以及与其他阿里云服务（如OSS对象存储、MaxCompute等）的集成，来支持高效的数据处理和机器学习任务。
实践案例：分享实际应用案例，展示如何在EMR上部署和优化特定的机器学习算法或模型，比如分布式深度学习框架的使用、迭代优化策略、模型并行化与数据并行化的实现等。
性能优化与调优：讲解在EMR上进行机器学习作业时的性能监控、资源分配优化、以及针对不同应用场景的调优技巧。
未来展望：可能会谈及机器学习在云计算环境下的发展趋势，以及EMR平台未来可能引入的新功能和技术，以更好地支持机器学习和人工智能领域的创新。

如果您对这个主题感兴趣，建议直接访问提供的链接下载分享资料，以获取更详细的信息和第一手的技术实践内容。同时，阿里云官网和阿里云开发者社区也是获取最新技术动态、教程和最佳实践的好去处。

有帮助

无帮助

AI 助理回答生成答案可能存在不准确，仅供参考

0 条回答

写回答

取消提交回答

问答分类：

机器学习/深度学习算法云栖大会人工智能平台 PAI

问答标签：

人工智能平台 PAI实践 emr实践 emr机器学习机器学习emr 机器学习平台 PAI实践

问答地址：

开发者社区 > 人工智能 > 问答

相关问答

天池学习>机器学习入门与实践，这里面的几节课都已经打不开了，求修复！

266

1

0

机器学习PAI实践文档里，所有操作都是用代码完成的，实际上是不是很多操作可以通过配置实现，怎么做呢？

143

1

0

机器学习PAI训练数据的原始 hive表存在emr集群，pai如何才能组装好训练数据进行模型训练呢？

193

1

0

魔搭社区pai的cpu环境—魔搭ModelScope社区模型库可以做实践吗？

208

1

0

机器学习PAI离线有支持emr hive表的计划吗？

159

2

0

机器学习PAI问下现在EasyRec 还是直接买EMR吗？

209

1

0

你好用机器学习PAI的emr上的ds集群读hive可以读取我现有hadoop集群的hive数据吗？

111

1

0

微博机器学习在阿里云上实践体现了哪些方面？

505

1

0

微博机器学习在阿里云上实践运用了哪些工具？

603

1

0

EMR集群的基本操作在什么渠道可以实践体验？

1419

1

0

问答排行榜

最热

最新

【大咖问答】对话PostgreSQL 中国社区发起人之一，阿里云数据库高级专家德哥

据说在家办公的程序员是这样写代码的？

如何升级配置

【藏经阁一起读（27）】本周推荐《Apache Flink案例集（2022版）》，你有哪些心得？

【精品问答】python技术1000问(1)

内存被通义灵码吃光了。我电脑总共48G的内存，被通义灵码吃掉了30几G，你们搞什么飞机？

我下载的gguf文件，最新的LMSTUDIO仍然无法识别什么问题

CoPAW配置后，对话，出现 AGENT_UNKNOWN_ERROR 如何解决

copaw安装后，出现这个情况，在设置模型的过程中出现这个问题，如何解决

Qwen OpenAI-Responses 兼容模式有问题

相关文章

DeepSeek 双百万 token 窗口对话数据的量化对比分析

AI服务器怎么收费？阿里云AI云服务器支持NVIDIA A10、V100、T4、P4、P100 GPU卡费用清单

基于网格搜索与分段回归的时间序列变化点检测方法

懂算法不等于搞定数据流：通信物理层的“黑盒”困境

懂算法不等于搞定数据流：通信物理层的“黑盒”困境

相关解决方案

更多

云消息队列 RabbitMQ 实践

AI 时代的分布式多模态数据处理实践

流批一体 LakeHouse 架构实践

Serverless 事件驱动架构实践

多源数据下的企业 AI 助手实践

还有其他疑问?