开发者社区> 问答> 正文

spark MLlib中的TF-IDF是什么?

spark MLlib中的TF-IDF是什么?

展开
收起
游客k7rjnht6hbtk6 2021-12-09 20:20:00 302 0
1 条回答
写回答
取消 提交回答
  • 词频-逆文档频率是一种用来从文本文档生成特征向量的简单方法,TF是每个词在文档中出现的次数,IDF是用来衡量一个词在整个文档corpus出现的逆频繁程度,TF-IDF展示了一个词与特点文档的相关程度

    2021-12-09 20:20:15
    赞同 展开评论 打赏
问答分类:
问答地址:
问答排行榜
最热
最新

相关电子书

更多
Apache spark Mllib's 立即下载
Apache Spark MLlib 2.x:How to 立即下载
Apache Spark MLlib's past traj 立即下载