开发者社区 问答 正文

Python 数据挖掘中的向量表示是如何进行计算的?

已解决

Python 数据挖掘中的向量表示是如何进行计算的?

展开
收起
gxx1 2022-07-23 15:00:45 602 分享
分享
版权
举报
1 条回答
写回答
取消 提交回答
  • 推荐回答

    1.权重计算,N个训练文档;

    WM*N=(Wij)  

    2.词频统计 

    ①TFi,:特征i在文档j中出现次数,词频(Term Frequency) 

    ②DF,:所有文档集合中出现特征i的文档数目,文档频率(DocumentFrequency)       

    3.词项的权重:{0,1}, tf(词频=term frequency),tf*idf

    2022-07-23 15:20:49 举报
    赞同 评论

    评论

    全部评论 (0)

    登录后可评论