开发者社区 > 大数据与机器学习 > 人工智能平台PAI > 正文

机器学习PAI、PAI-Designer、PAI-DSW、PAI-EAS中想用【图像分类训练】的组?

机器学习PAI、PAI-Designer、PAI-DSW、PAI-EAS中想用【图像分类训练】的组件的话,如果数据转tfrecord组件的上游如果是oss来源的话,原始数据在oss中的应该是什么样的呢?每个类别分别在一个文件夹中名称以类别名称命名还是?图像分类训练(torch)对上传的预训练模型有什么要求呢,总是The model and loaded state dict do not match exactly,数据集比较简单,不上传时效果也很差。

展开
收起
cuicuicuic 2023-05-16 17:37:22 162 0
3 条回答
写回答
取消 提交回答
  • 值得去的地方都没有捷径

    首先,对于PAI平台中的图像分类训练组件,如果数据来源于OSS,其目录结构通常应该是每个类别一个文件夹,文件夹名称使用类别的名称。在每个类别文件夹中,应该包含该类别的所有图像。这种目录结构的好处是使得数据集更加有组织和易于管理。

    其次,对于图像分类训练(torch)组件,要求上传的预训练模型与要训练的模型具有相同的网络架构,即二者都应该是相同的深度学习网络模型。此外,确保上传的预训练模型是经过预处理的,即与训练数据集相同的预处理步骤。

    最后,如果您的数据集比较简单,模型的表现也不理想,您可以尝试使用已经经过预训练的模型来进行微调。这样做通常会提高模型的性能,因为已经经过预训练的模型已经具有强大的特征提取能力。同时,还可以尝试使用数据增强技术来扩增数据集,以帮助模型更好地泛化。

    2023-05-23 08:50:25
    赞同 展开评论 打赏
  • 公众号:网络技术联盟站,InfoQ签约作者,阿里云社区签约作者,华为云 云享专家,BOSS直聘 创作王者,腾讯课堂创作领航员,博客+论坛:https://www.wljslmz.cn,工程师导航:https://www.wljslmz.com

    在阿里云机器学习PAI、PAI-Designer、PAI-DSW、PAI-EAS中使用【图像分类训练】组件,如果数据转tfrecord组件的上游是oss,需要保证数据集的格式满足以下要求:

    1. 每个类别的图像数据应该放在一个单独的文件夹中,文件夹的名称应该与类别名称一致。

    2. 每个图像文件应该包含一个标签,标签的值应该与图像所在文件夹的名称一致。

    3. 所有图像文件应该放在同一个根目录下,并且根目录下不应该包含其他文件夹或者文件。

    例如,如果有3个类别(猫、狗、鸟),则可以将所有猫的图像放在一个名为“cat”的文件夹中,所有狗的图像放在一个名为“dog”的文件夹中,所有鸟的图像放在一个名为“bird”的文件夹中。然后将这3个文件夹上传到oss中,作为数据转tfrecord组件的输入。

    对于上传的预训练模型,需要保证模型的结构和训练时所使用的结构完全一致。如果模型结构不一致,则会出现“The model and loaded state dict do not match exactly”的错误。如果数据集比较简单,效果较差,可以尝试增加数据量、调整模型结构或者使用其他的预训练模型来提高模型的准确率。

    2023-05-16 18:33:36
    赞同 展开评论 打赏
  • https://help.aliyun.com/document_detail/164248.html?spm=a2c4g.164247.0.0.5d9478ec9nsndq可以参考这个~,此回答整理自钉群“机器学习PAI交流群(答疑@值班)”

    2023-05-16 17:49:00
    赞同 展开评论 打赏

相关产品

  • 人工智能平台 PAI
  • 热门讨论

    热门文章

    相关电子书

    更多
    大规模机器学习在蚂蚁+阿里的应用 立即下载
    阿里巴巴机器学习平台AI 立即下载
    微博机器学习平台架构和实践 立即下载