开发者社区> 问答> 正文

Python 数据挖掘中的向量表示是如何进行计算的?

已解决

Python 数据挖掘中的向量表示是如何进行计算的?

展开
收起
gxx1 2022-07-23 15:00:45 584 0
1 条回答
写回答
取消 提交回答
  • 推荐回答

    1.权重计算,N个训练文档;

    WM*N=(Wij)  

    2.词频统计 

    ①TFi,:特征i在文档j中出现次数,词频(Term Frequency) 

    ②DF,:所有文档集合中出现特征i的文档数目,文档频率(DocumentFrequency)       

    3.词项的权重:{0,1}, tf(词频=term frequency),tf*idf

    2022-07-23 15:20:49
    赞同 展开评论 打赏
问答排行榜
最热
最新

相关电子书

更多
From Python Scikit-Learn to Sc 立即下载
Data Pre-Processing in Python: 立即下载
双剑合璧-Python和大数据计算平台的结合 立即下载