开发者社区 问答 正文

Base Transformer和SuperRes Transformer在训练过程中分别实现什么功

Base Transformer和SuperRes Transformer在训练过程中分别实现什么功能?

展开
收起
夹心789 2024-06-30 22:36:27 46 分享 版权
1 条回答
写回答
取消 提交回答
  • 在训练过程中,Base Transformer实现的功能是输入被Mask掉的image tokens,并基于text embedding预测被mask掉的token。而SuperRes Transformer则负责输入被Mask掉的image tokens,并基于text embedding和生成阶段的结果预测被mask掉的token,以实现图像的超分辨率生成。

    2024-06-30 22:50:51
    赞同 1 展开评论
问答地址: