问题1:NLP自学习平台这个长度是多少 啊? 我们训练数据的时候自己过滤一下
问题2:那也就是说 还是对训练 数据总量 有控制?
在NLP自学习平台上,每个标签的长度是不确定的,可能会因为不同的标签而取不同的值。但是,每个标签最多只能包含一个字符。如果每个标签只有一个字符,那么在一个标签列表中,每个标签最多只能包含 65536 个标签。如果超过了这个数量,平台可能无法进行训练,因为具体标签数量超过了平台的限制。对于训练数据概述是否有控制,这个要看具体的训练需求。在NLP自学习平台上,可以任意上传数量的数据,但是平台可能对数据进行筛选或者过滤,以保证训练的质量和效果。另外,平台也可能对数据进行分批实地进行训练,要充分利用服务器资源,并保证训练的顺利进行。
回答1:总长度是65536,不是一个标签,是所有标签去重之后的合计
回答2:你理解的不对,是对标签总量的限制,此回答整理自钉群“阿里云NLP自学习平台用户答疑群二群”
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。