开发者社区 > 大数据与机器学习 > 人工智能平台PAI > 正文

请问离线预标注数据文件格式是什么样的?

已解决

请问离线预标注数据文件格式是什么样的?

展开
收起
felix@ 2023-01-17 22:39:05 669 0
2 条回答
写回答
取消 提交回答
  • 今天也要加油吖~
    采纳回答

    您好,离线预标注数据文件的格式需要包含自定义字段和source两个字段,而且自定义字段不能缺少,并且支持添加多个自定义字段。

    2023-01-17 22:42:19
    赞同 展开评论 打赏
  • 准备离线预标注数据文件(prelabel_offline.manifest),并创建为OSS类型的数据集。 - 离线预标注数据文件的格式如下,需要包含自定义字段和source两个字段,且离线预标注数据文件中,自定义字段不能缺少,且支持添加多个自定义字段。

    {
        "data": {
            "label": "label_2",
            "source": "阿里巴巴集团庆祝创立十周年,同时成立阿里云计算"
        }
    }
    

    其中: label:离线生成的预标注结果。 source:原始数据。 不同标注类型文件的整体格式要求请参见创建数据集:用于数据标注。如果离线预标注数据文件不满足格式要求,可能会导致预标注结果不能正常显示。 - 将离线预标注数据文件创建为数据集时,需创建为OSS类型的数据集

    2023-01-18 23:04:36
    赞同 展开评论 打赏

人工智能平台 PAI(Platform for AI,原机器学习平台PAI)是面向开发者和企业的机器学习/深度学习工程平台,提供包含数据标注、模型构建、模型训练、模型部署、推理优化在内的AI开发全链路服务,内置140+种优化算法,具备丰富的行业场景插件,为用户提供低门槛、高性能的云原生AI工程化能力。

相关电子书

更多
低代码开发师(初级)实战教程 立即下载
冬季实战营第三期:MySQL数据库进阶实战 立即下载
阿里巴巴DevOps 最佳实践手册 立即下载