可以帮忙看下机器学习PAI的这个问题么?https://github.com/alibaba/FastNN/issues/15
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。
根据您提供的链接内容,虽然我无法直接访问外部链接(如GitHub),但我可以根据您提到的问题以及知识库中的相关资料,为您提供关于阿里云机器学习平台PAI和FastNN的详细解答。
如果您遇到的是与FastNN相关的问题,以下是一些可能的解决方案和排查步骤,基于知识库中的信息:
FastNN是PAI模型仓库中的一部分,支持多种经典算法(如Inception、ResNet、VGG等)并内置在Designer平台中。它主要用于高效训练模型,并支持读取tfrecord
格式的数据。
如果您的问题涉及数据处理或模型训练,请参考以下步骤进行排查。
tfrecord
格式的数据集。如果数据格式不正确或路径配置错误,可能会导致训练失败。mnist
、cifar10
和flowers
数据集的存储路径如下:mnist
:oss://pai-online-beijing.oss-cn-beijing-internal.aliyuncs.com/fastnn-data/mnist/
cifar10
:oss://pai-online-beijing.oss-cn-beijing-internal.aliyuncs.com/fastnn-data/cifar10/
flowers
:oss://pai-online-beijing.oss-cn-beijing-internal.aliyuncs.com/fastnn-data/flowers/
解决方法:
cifar10
数据解析代码应包含以下内容:features = {
'image/encoded': tf.FixedLenFeature((), tf.string, default_value=''),
'image/format': tf.FixedLenFeature((), tf.string, default_value='png'),
'image/class/label': tf.FixedLenFeature([], tf.int64, default_value=tf.zeros([], dtype=tf.int64)),
}
def parse_fn(example):
with tf.device("/cpu:0"):
features = tf.parse_single_example(
example,
features=features
)
image = tf.image.decode_jpeg(features['image/encoded'], channels=3)
label = features['image/class/label']
return image, label
tfrecord
文件的样本数量和每个worker处理的文件数量保持一致。config.txt
)是否正确。如果上述方法未能解决问题,请考虑以下可能性:
如果问题仍未解决,您可以尝试以下方法: - 联系技术支持:提供详细的错误日志和复现步骤,以便技术支持团队快速定位问题。 - 参考官方文档:更多关于FastNN的使用说明和最佳实践,请参考PAI官方文档。
希望以上信息能帮助您解决问题!如果问题的具体描述可以进一步明确,我将为您提供更精准的解答。
人工智能平台 PAI(Platform for AI,原机器学习平台PAI)是面向开发者和企业的机器学习/深度学习工程平台,提供包含数据标注、模型构建、模型训练、模型部署、推理优化在内的AI开发全链路服务,内置140+种优化算法,具备丰富的行业场景插件,为用户提供低门槛、高性能的云原生AI工程化能力。