问题一:咨询下机器学习PAI,ckpt中的varible 只有一个part-0 正常吗?
咨询下机器学习PAI,训练模型使用了5个ps,ckpt中的varible 只有一个part-0 正常吗?另外,使用estimator定义模型,训练指标正常;训练结束后,调用evaluate 进行单机ckpt load(restore 方法),测试集的指标低很多包含ev的ckpt 调用restore 方法,有问题吗?
参考回答:
如果你partitioner使用的是min_max,这种情况是可能存在的;目前情况来看ev只有一个分片,如果这个evaluate和train的结果不一致,建议你可以拿几条样本对比一下 。
关于本问题的更多回答可点击原文查看:
https://developer.aliyun.com/ask/580095
问题二:在学习机器学习PAIeasyrec ,想问下每个block的所有可选配置和对应的含义有文档可查吗?
在学习机器学习PAIeasyrec ,想问下每个block的所有可选配置和对应的含义有文档可查吗?
例如此处wide_output_dim没有解释具体是什么意思(虽然也能猜到是什么意思)
参考回答:
wide部分输出一维数据
关于本问题的更多回答可点击原文查看:
https://developer.aliyun.com/ask/580780
问题三:有不用部署,直接调机器学习PAI的方式吗?
有不用部署,直接调机器学习PAI的方式吗?
参考回答:
灵积模型可以试试,俺觉得好用[ https://dashscope.console.aliyun.com/ ]
关于本问题的更多回答可点击原文查看:
https://developer.aliyun.com/ask/579638
问题四:想知道一下PAI是在配置哪里的时候配置的user和item节点?
想知道一下PAI是在配置哪里的时候配置的user和item节点?
参考回答:
调度是实际上线运行了需要调度。你目前如果只是根据文档跑结果,暂时不需要调度,可以忽略调度这一块先把别的走通。
等你真正有了线上的 user 表,item 表,那个时间就需要调度了。
关于本问题的更多回答可点击原文查看:
https://developer.aliyun.com/ask/581969
问题五:想问一下机器学习PAI,BladeDISC和IREE有啥区别?
想问一下机器学习PAI,BladeDISC和IREE有啥区别?两者谁支持NVIDIA GPU更好
参考回答:
楼主你好,看了你的描述,机器学习PAI、阿里云BladeDISC和IREE是三个不同的机器学习相关产品,它们有以下区别:
- 机器学习PAI(Platform of AI):机器学习PAI是阿里云提供的一种全面的机器学习平台,它提供了各种机器学习算法和工具,包括数据预处理、模型训练和评估等功能,机器学习PAI主要用于构建和部署机器学习模型。
- 阿里云BladeDISC:BladeDISC是阿里云推出的一种高性能分布式训练服务,它基于分布式深度学习平台PAI-DL(Platform of AI for Deep Learning)开发,BladeDISC提供了分布式训练的能力,可以加速深度学习模型的训练过程,特别适用于大规模数据和复杂模型的训练任务。
- IREE(Integrated Runtime for Edge Execution):IREE是谷歌开源的一个用于优化和执行深度学习模型的项目。它旨在提供高性能、低功耗的边缘设备上的模型推理能力,IREE支持多种硬件加速器,包括NVIDIA GPU、ARM Mali GPU等。
就NVIDIA GPU的支持而言,阿里云的BladeDISC和IREE都提供对NVIDIA GPU的支持。
关于本问题的更多回答可点击原文查看: