开发者社区> 问答> 正文

关于虚拟机及ODPS的一些问题与希望

1、Xlib库的二次开发
Xlib提供了很丰富的机器学习算法,但是现在看到都是以jar包的形式提供的,不知道有没有能重新编译或者进行修改的办法。
比如说,logistic回归的参数中不能调整权值,但是再重新造一遍轮子意义就不大了
GBRT已经给出来了,但是如果想修改cost function,就跪了。
想问一下究竟有没有可以二次开发的途径呢?
2、依赖库的安装
之前提到过希望ODPS上有什么工具,如果二次开发不可以的话,依赖库可能是更需要的吧。
诸如Weka、Sklearn这样的机器学习库有没有安装的途径呢?


3、虚拟机的上传问题
之前很多的代码其实在现在也是可以复用的,特别是文件大小是2G,其实也不是大到难以想象,不知道能否有上传代码的途径?
4、开发软件的安装
因为必须要在虚拟机上开发,那么常见的开发软件诸如Vim、Emacs这类的编辑器,SVN、Git这种版本控制工具是不是都能提高一下?


暂时想到这么多,欢迎补充

展开
收起
holdybb 2014-04-25 11:07:14 8107 0
2 条回答
写回答
取消 提交回答
  • Re关于虚拟机及ODPS的一些问题与希望
    主办方只需要把怎么利用平台进行分布式计算的接口和例子给出就行了,至于如何将算法改造运行在分布式平台下应该是参赛选手自己考虑的事情。
    2014-04-25 12:42:08
    赞同 展开评论 打赏
  • Re关于虚拟机及ODPS的一些问题与希望
    针对问题1,我解释下:
    同学们针对xlib的需求大体集中在两个方面:
    1. 定制xlib。这部分odps暂时还无法支持。楼主在虚拟机的xlab里看到的jar包不是真正的xlib算法包。只是一个客户端而已。xlib的算法都是分布式实现的,本地是看不到的。
    2. 第三方的算法库。这个需求如果合理,我们可以满足。但目前同学们提供的算法库基本都是单机版的,不能够分布式实现。如果xlib想分布式实现这些算法库,需要一定时间。
    2014-04-25 11:28:18
    赞同 展开评论 打赏
问答排行榜
最热
最新

相关电子书

更多
低代码开发师(初级)实战教程 立即下载
冬季实战营第三期:MySQL数据库进阶实战 立即下载
阿里巴巴DevOps 最佳实践手册 立即下载