开发者社区> 问答> 正文

文本挖掘模型由什么构成呀?

已解决

文本挖掘模型由什么构成呀?

展开
收起
月亮很亮 2022-07-24 19:19:03 364 0
1 条回答
写回答
取消 提交回答
  • 推荐回答

    首先需要有文本源,就是文本数据在哪里,下一步是行文本分析,文本源有了以后需要做文本分析,将非结构化的文本转成有结构化的,对文本进行分词,这对中文非常重要,然后数据处理一些特别的词,例如数字处理,日期处理,名字识别,词性标注等,进一步可以做文本的结构分析,作文本里面的主谓宾,依存关系句法分析等,在下一步是做文本的特征提取,面这些技术准备好了以后就可以做文本挖掘的应用了,例如做文本检索,文本的聚类,文本的过滤,做热门话题的检查和跟踪,然后再整合一个界面供用户使用,这就是一个一般的文本挖掘的模型。

    2022-07-24 20:58:06
    赞同 展开评论 打赏
问答地址:
问答排行榜
最热
最新

相关电子书

更多
信息检索与机器学习的华尔兹 立即下载
机器学习中,使用Scikit-Leam简单处理文本数据 立即下载
纯干货 | 机器学习中梯度下降法的分类及对比分析 立即下载