在SPARK SUMMIT 2017上,Yanbo Liang Apache Spark committer分享了题为《Scaling Apache Spark MLlib to billions of parameters》,就Spark上无矢量L-BFGS,无载体L-BFGS的Logistic回归分析,性能,与现有的MLlib集成等方面的内容做了深入的分析。
https://yq.aliyun.com/download/2262?spm=a2c4e.11154804.0.0.1da06a79oC9KEQ
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。
在SPARK SUMMIT 2017上,Yanbo Liang作为Apache Spark的Committer分享了题为《Scaling Apache Spark MLlib to Billions of Parameters》的演讲。该演讲深入探讨了如何在Spark上扩展MLlib以处理数十亿参数量级的机器学习任务,特别是针对无矢量化(vector-less)和无载体(carrier-less)L-BFGS算法在逻辑回归分析中的应用、性能优化,以及这些改进如何与现有的MLlib框架无缝集成。
虽然给出的知识库资料未直接包含该演讲内容的详细信息,但可以理解您可能对如何在Spark中高效执行大规模机器学习任务,尤其是使用L-BFGS算法进行优化感兴趣。对于希望深入了解或复现类似演讲中提及技术的用户,以下是一些建议路径:
技术背景:
环境准备:
具体实现步骤:
注意事项:
验证与测试:
参考资料:
请注意,上述建议是基于您的兴趣点和知识库中可用信息综合而成,实际操作时还需结合最新的研究成果和技术文档进行。