开发者社区> 问答> 正文

NLP自学习平台这个长度是多少 啊? 我们训练数据的时候自己过滤一下

问题1:NLP自学习平台这个长度是多少 啊? 我们训练数据的时候自己过滤一下
问题2:那也就是说 还是对训练 数据总量 有控制?

展开
收起
真的很搞笑 2023-07-11 17:52:53 38 0
2 条回答
写回答
取消 提交回答
  • 北京阿里云ACE会长

    在NLP自学习平台上,每个标签的长度是不确定的,可能会因为不同的标签而取不同的值。但是,每个标签最多只能包含一个字符。如果每个标签只有一个字符,那么在一个标签列表中,每个标签最多只能包含 65536 个标签。如果超过了这个数量,平台可能无法进行训练,因为具体标签数量超过了平台的限制。对于训练数据概述是否有控制,这个要看具体的训练需求。在NLP自学习平台上,可以任意上传数量的数据,但是平台可能对数据进行筛选或者过滤,以保证训练的质量和效果。另外,平台也可能对数据进行分批实地进行训练,要充分利用服务器资源,并保证训练的顺利进行。

    2023-07-11 22:30:33
    赞同 展开评论 打赏
  • 回答1:总长度是65536,不是一个标签,是所有标签去重之后的合计
    回答2:你理解的不对,是对标签总量的限制,此回答整理自钉群“阿里云NLP自学习平台用户答疑群二群”

    2023-07-11 18:45:06
    赞同 展开评论 打赏
问答排行榜
最热
最新

相关电子书

更多
自然语言处理得十个发展趋势 立即下载
自然语言处理的十个发展趋势 立即下载
深度学习与自然语言处理 立即下载