百度开放研究云平台
百度开放研究云平台由百度开放研究计划支持而建设的。当前已建成基于开源Hadoop 1.0.0而构建的开放数据分析平台,将逐步投入数百台服务器来支持海量数据分析。同时也将不断在平台上放置来自百度产品和系统的数据供学术研究使用。来自学术界的使用者可以在该平台上开展数据分析的研究。
百度开放研究云平台是面向学术界免费使用的。有意使用者可以向campuscloud@baidu.com发信了解更多信息。
为了使用户在开放研究云平台上有与通过命令行使用Hadoop一致的体验,也为了提高在开放环境下使用Hadoop平台的安全性,百度开放研究云平台提供基于WEB的使用界面,提供类似web shell的使用方式。用户通过WEB页面的输入区域提交命令,并在WEB页面上展示命令执行过程及相应的输出信息。
具体详见使用说明。
mahout兴趣小组
用户可以在百度开放研究社区注册登录,并使用同一账号登录百度开放研究云平台(平台还处于适用阶段,账号名须是英文数字的组合)。百度开放研究社区目前还未正式上线,板块、内容都在增加和调整中,会有相关算法背景的师生提供一些简单的mahout算法的使用例程,帮助熟悉基于云平台上跑mahout或者自己的mapreduce算法。
社区还处于建立阶段,社区内资源也正在推出中。社区成立目的是基于百度提供的开发资源(集群和数据),吸引爱好hadoop,mahout,数据挖掘/机器学习算法的人一起学习交流。有意向的人可以联系shihongzhu@baidu.com,或者加qq群97282906,或者通过本博客置顶篇的信息联系我。
关于社区的进一步发展和组建信息还会在本文更新,期待您的加入!