ModelScope数据集要求什么格式呢?

ModelScope数据集要求什么格式呢?

展开
收起
小小爱吃香菜 2024-05-01 08:56:41 224 分享 版权
1 条回答
写回答
取消 提交回答
  • 某政企事业单位安全运维工程师,主要从事系统运维及网络安全工作,多次获得阿里云、华为云、腾讯云征文比赛一二等奖;CTF选手,白帽,全国交通行业网络安全大赛二等奖,全国数信杯数据安全大赛银奖,手握多张EDU、CNVD、CNNVD证书,欧盟网络安全名人堂提名,联合国网络安全名人堂提名

    ModelScope数据集支持多种格式,具体要求依据数据类型和标注方式而定。以下是关键要点:

    文本数据集:

    使用通用模板创建时,需要.manifest或.TXT文件,内容格式为:{"data":{"source":"文本内容"}},每行一个样本。
    文件需上传至阿里云OSS,然后通过OSS路径创建数据集。

    图像/视频/音频数据集:

    图像、视频或音频文件需上传至阿里云OSS,系统通过扫描文件夹创建数据集时,会自动生成.manifest文件。
    直接使用OSS存储路径URL来创建数据集。

    自定义模板:

    支持更灵活的标注场景,如同时标注图片、文本等,具体格式和创建步骤依据自定义需求。

    其他通用要求:

    数据集名称应简短且描述性强,限30字符内。
    若通过界面上传ZIP文件,扩展名须为.zip,大小不超过2GB,图片数量建议不超过2000张,且图像命名仅支持字母、数字、下划线。

    确保遵循这些格式和要求以便在ModelScope上高效管理和使用数据集。

    创建数据集:用于数据标注 创建数据集:通用模板数据标注场景

    如何进行数据集管理 新建数据集

    DashVector + ModelScope 玩转多模态检索 前提准备

    2024-05-01 20:36:28
    赞同 2 展开评论

ModelScope旨在打造下一代开源的模型即服务共享平台,为泛AI开发者提供灵活、易用、低成本的一站式模型服务产品,让模型应用更简单!欢迎加入技术交流群:微信公众号:魔搭ModelScope社区,钉钉群号:44837352

热门讨论

热门文章

还有其他疑问?
咨询AI助理