问题一:机器学习PAI 为什么还是1000个step才记录一次summaries?
机器学习PAI save_summary_steps这个配置项我设置了值为50,为什么还是1000个step才记录一次summaries?
参考回答:
eval 评估次数应该只是和 save_checkpoints_steps 有关,每一次保存 checkpoint 的时候,评估一次
关于本问题的更多回答可点击原文查看:
https://developer.aliyun.com/ask/577001
问题二:机器学习PAI 不编译debug版本,那一般怎么debug c++代码?
机器学习PAI 不编译debug版本,那一般怎么debug c++代码?
参考回答:
如果是 pass pipeline 的话可以看日志,gdb 确实需要 debug 版本,可以先试试 。
关于本问题的更多回答可点击原文查看:
https://developer.aliyun.com/ask/582114
问题三:机器学习PAI 编译默认是debug吗?
机器学习PAI 编译默认是debug吗?我看这里没有debug信息,怎么配置能编译出能调试的debug版本
参考回答:
默认没有加debug,可以用 export DEBUG=ON 打开,但有可能会有编不过的情况,这块我们 CI 没有验证
关于本问题的更多回答可点击原文查看:
https://developer.aliyun.com/ask/582113
问题四:机器学习PAI 1千万的数据量不知道需要多少资源?
机器学习PAI 1千万的数据量不知道需要多少资源?
参考回答:
机器学习项目中,所需的计算资源取决于多种因素,包括模型的复杂度、数据集的大小、所使用的计算设备的性能、批处理大小和迭代次数等。对于1千万的数据量,确切的资源需求会因上述各个因素的影响而有所不同。
为了得到一个较为准确的估算,您可以首先确定您想要使用的模型以及其复杂度。例如,如果您选择使用深度学习模型,可能需要更多的计算资源。接着,考虑到您的数据集大小为1千万,这本身就需要大量的存储空间和内存来处理。同时,您还需要考虑批处理的大小和预期的迭代次数。
关于本问题的更多回答可点击原文查看: