"NLP自学习平台阿里云是否有数据标注可以购买的?数据几万条应该可以有,不知道需要多少数据才能构架一个比较稳定的模型 我这边是想要构建招标中标信息提取类的,阿里云现有的模型 某些字段提取还是缺了点。
目前库里有202w数据,陆陆续续还在采集种 不知道需要多少样本才能构建一个比较稳定的模型?因为自己标注数据太费时间和人力了,不知道有没有直接售卖标注好的数据集,让我可以购买导入训练模型。"
阿里云提供的NLP自学习平台并不直接提供数据标注服务。然而,阿里云的人工智能市场和众包服务可能有与数据标注相关的产品和服务可供购买。
在阿里云的人工智能市场,您可以浏览并购买各类与NLP数据标注相关的产品或解决方案。这些产品或解决方案可能由第三方开发商提供,包括数据标注工具、标注平台、标注模型等。
此外,阿里云也提供众包服务,通过该服务,您可以委托阿里云的众包团队或合作伙伴来进行数据标注。您可以将标注任务描述以及相关要求提交给众包服务,他们会为您提供相应的数据标注服务。
阿里云的NLP自学习平台可以满足你的需求,它面向算法小白用户,无需具备丰富的算法背景,通过标注或上传适量文档数据,即可创建并使用算法模型。如果你需要进一步训练模型,还需要购买模型包月。
对于你的问题,即需要多少数据才能构建一个比较稳定的模型,其答案并不是一蹴而就的。数据集数量和模型的准确性并没有直接关系。不过,需要注意的是,当你的标注数据量达到500份以上时,模型的准确率可以达到85%以上。所以,你可以根据这个标准以及你自身的需求来决定你需要的数据量。
"我们现在是不售卖数据的, 你们可以提供数据给我们 然后跑了给到你这边。
此答案整理至钉群""阿里云NLP基础服务2.0 - 用户答疑群""。"
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。