问题一:大数据计算MaxCompute有没有什么方式, 不使用udf的方式,调度xgb直接使用mc资源呢?
大数据计算MaxCompute有没有什么方式, 不使用udf的方式,调度xgb直接使用mc资源呢?
参考回答:
这期确实还不行,目前分布式算子我们先做了Pandas,后续会把xgboost、numpy这些做分布式。
关于本问题的更多回答可点击原文查看:https://developer.aliyun.com/ask/614960
问题二:大数据计算MaxCompute的udf是针对数据每行进行操作的,xgb需要对数据整体操作,该怎么改?
大数据计算MaxCompute的udf是针对数据每行进行操作的,xgb需要对数据整体操作,该怎么改?
参考回答:
xgboost确实比较特殊,需要在UDF里支持batch,这个目前还没有。
关于本问题的更多回答可点击原文查看:https://developer.aliyun.com/ask/614959
问题三:大数据计算MaxCompute碰到这种情况应该怎么转换maxframe里的dataframe呢?
大数据计算MaxCompute碰到这种情况应该怎么转换maxframe里的dataframe呢?
参考回答:
现在pivot还没有支持。先这样绕过一下
PyODPS DataFrame下载到本地(如使用to_pandas()方法转换为Pandas DataFrame),然后在本地使用Pandas的pivot函数进行转换。之后再将转换后的数据重新上传回MaxCompute。
关于本问题的更多回答可点击原文查看:https://developer.aliyun.com/ask/614956
问题四:大数据计算MaxCompute无法安装怎么解决?
大数据计算MaxCompute无法安装怎么解决?
参考回答:
手动输入pip install maxframe==0.1.0b3
关于本问题的更多回答可点击原文查看:https://developer.aliyun.com/ask/614954
问题五:大数据计算MaxCompute这个问题怎么解决?
大数据计算MaxCompute这个问题怎么解决?
参考回答:
独享资源组需要自己pip install maxframe。
关于本问题的更多回答可点击原文查看:https://developer.aliyun.com/ask/614953