开发者社区 问答 正文

Python 数据挖掘中文本表示的分类有哪些呢?

已解决

Python 数据挖掘中文本表示的分类有哪些呢?

展开
收起
gxx1 2022-07-23 15:49:11 590 分享
分享
版权
举报
1 条回答
写回答
取消 提交回答
  • 推荐回答

    1. 离散表示(列出一些常用的方法) :

    词袋模型( Bag of Words),缩写是BOW;TF-IDF (Term Frequency - Inverse Document Frequency);One-hot编码( 独热编码 );Bi-gram和N-gram;词-文档矩阵(单元格是词的权重)   

    2. 分布式表示:

    对词-文档矩阵降维(例如使用PCA降维);神经网络语言模型(例如word2vec),语言模型是用来计算一个句子出现概率的模型。

    2022-07-23 15:55:31 举报
    赞同 评论

    评论

    全部评论 (0)

    登录后可评论
AI助理

你好,我是AI助理

可以解答问题、推荐解决方案等