热门
有开源的垂直领域英中数据集吗,专业术语那种,很多开源数据集连个cbam自动驾驶这种近几年的名词都翻译不出来,偏论文术语的数据集
我也想知道,csanmt有没有可以接入术语库功能的接口
目前没有专门收集垂直领域的中英互译开源数据集,Modelscope采用WMT、OPUS和mtdata三个数据源训练。其中,WMT可以通过我们dataset的sdk来使用,OPUS和mtdata分别可以从这里获取:https://github.com/thammegowda/mtdata和https://opus.nlpl.eu/。
包含命名实体识别、文本分类、分词、关系抽取、问答、推理、文本摘要、情感分析、机器翻译等多个领域