开发者社区 问答 正文

GPT-2的数据集是什么?

GPT-2的数据集是什么?

展开
收起
夹心789 2024-05-30 13:43:38 81 分享 版权
1 条回答
写回答
取消 提交回答
  • GPT-2的数据集选用的是reddit里面已经被人工筛选出的有意义的,并且具有至少3karma值的网页。整个数据集包含大约800万个文本,总共约40GB的文字。

    2024-05-30 14:32:46
    赞同 展开评论
问答标签:
问答地址: