机器学习PAI、PAI-Designer、PAI-DSW、PAI-EAS中想用【图像分类训练】的组？

机器学习PAI、PAI-Designer、PAI-DSW、PAI-EAS中想用【图像分类训练】的组件的话，如果数据转tfrecord组件的上游如果是oss来源的话，原始数据在oss中的应该是什么样的呢？每个类别分别在一个文件夹中名称以类别名称命名还是？图像分类训练(torch)对上传的预训练模型有什么要求呢，总是The model and loaded state dict do not match exactly，数据集比较简单，不上传时效果也很差。

展开

收起

真的很搞笑 2023-05-16 17:37:22 367 版权

3 条回答

写回答

取消提交回答

ReaganYoung

值得去的地方都没有捷径

首先，对于PAI平台中的图像分类训练组件，如果数据来源于OSS，其目录结构通常应该是每个类别一个文件夹，文件夹名称使用类别的名称。在每个类别文件夹中，应该包含该类别的所有图像。这种目录结构的好处是使得数据集更加有组织和易于管理。

其次，对于图像分类训练（torch）组件，要求上传的预训练模型与要训练的模型具有相同的网络架构，即二者都应该是相同的深度学习网络模型。此外，确保上传的预训练模型是经过预处理的，即与训练数据集相同的预处理步骤。

最后，如果您的数据集比较简单，模型的表现也不理想，您可以尝试使用已经经过预训练的模型来进行微调。这样做通常会提高模型的性能，因为已经经过预训练的模型已经具有强大的特征提取能力。同时，还可以尝试使用数据增强技术来扩增数据集，以帮助模型更好地泛化。

2023-05-23 08:50:25

赞同展开评论
wljslmz

公众号：网络技术联盟站，InfoQ签约作者，阿里云社区签约作者，华为云云享专家，BOSS直聘创作王者，腾讯课堂创作领航员，博客+论坛：https://www.wljslmz.cn，工程师导航：https://www.wljslmz.com
在阿里云机器学习PAI、PAI-Designer、PAI-DSW、PAI-EAS中使用【图像分类训练】组件，如果数据转tfrecord组件的上游是oss，需要保证数据集的格式满足以下要求：
1. 每个类别的图像数据应该放在一个单独的文件夹中，文件夹的名称应该与类别名称一致。
2. 每个图像文件应该包含一个标签，标签的值应该与图像所在文件夹的名称一致。
3. 所有图像文件应该放在同一个根目录下，并且根目录下不应该包含其他文件夹或者文件。
例如，如果有3个类别（猫、狗、鸟），则可以将所有猫的图像放在一个名为“cat”的文件夹中，所有狗的图像放在一个名为“dog”的文件夹中，所有鸟的图像放在一个名为“bird”的文件夹中。然后将这3个文件夹上传到oss中，作为数据转tfrecord组件的输入。

对于上传的预训练模型，需要保证模型的结构和训练时所使用的结构完全一致。如果模型结构不一致，则会出现“The model and loaded state dict do not match exactly”的错误。如果数据集比较简单，效果较差，可以尝试增加数据量、调整模型结构或者使用其他的预训练模型来提高模型的准确率。
2023-05-16 18:33:36

赞同展开评论
芯在这

https://help.aliyun.com/document_detail/164248.html?spm=a2c4g.164247.0.0.5d9478ec9nsndq可以参考这个~，此回答整理自钉群“机器学习PAI交流群(答疑@值班)”

2023-05-16 17:49:00

赞同展开评论

机器学习PAI、PAI-Designer、PAI-DSW、PAI-EAS中想用【图像分类训练】的组？

人工智能平台PAI

相关文章

相关解决方案

热门讨论

热门文章