开发者社区 问答 正文

能否对采集的内容进一步筛选?

能否对采集的内容进一步筛选?

展开
收起
Puppet 2020-03-23 14:23:20 777 分享
分享
版权
举报
1 条回答
写回答
取消 提交回答
  • • 用户可以手动设定“过滤规则”,并可将文章列表中的批量内容提交至垃圾语料库(即手动标注为无效文章),通过机器学习,后续遇到该类内容时即可智能过滤。 • 智能过滤的效果取决于提交垃圾语料的数量,语料数量越多,过滤越准确。通常手动标注100篇左右的文章之后,系统自动过滤的准确性可以达到96%以上。 • 此外,过滤规则也可明确指定具体的关键词、作者或者某个源站,排除这些内容。

    2020-03-23 15:41:42 举报
    赞同 评论

    评论

    全部评论 (0)

    登录后可评论
问答地址:
AI助理

你好,我是AI助理

可以解答问题、推荐解决方案等