我看modelscope上给出的样例只包含了src_txt字段,但是我能不能用包含源文本和目标文本两个字段的数据去训练它,能实现吗?
您好,目前GPT-3只支持src_txt字段输入训练,采用auto-regressive方式训练,如果您的数据有输入和输出,可以把输入和输出拼接起来构造成src_txt训练,还可以通过构建prompt的方式串联起来
比如输入文章,输出摘要,可以把“文章”+“。上面文章的摘要是:”+“摘要”,构造成src_txt输入模型训练
另外,也推荐采用PALM预训练生成模型,由encoder-decoder架构构成,很适合源文本和目标文本的训练,参考模型页面的训练代码即可:https://modelscope.cn/models/damo/nlp_palm2.0_pretrained_chinese-base/summary