文档备案控制台

开发者社区问答正文

Python 数据挖掘中，文本相似度计算里基于语料库方法有哪些呢？

已解决

Python 数据挖掘中，文本相似度计算里基于语料库方法有哪些呢？

展开

收起

gxx1 2022-07-24 08:39:59 3064 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

gxx2

推荐回答

1. 基于词袋（VSM、LSA、PLSA、LDA）：不考虑词语在文档中出现的顺序,将文档表示成一系列词语的组合。

2. 基于神经网络：（Word2vec、Glove、Bert）：通过神经网络模型生成词向量，利用上下文生成低维的实数向量。

3. 基于搜索引擎：Web成为内容最丰富、数据量最大的语料库，与此同时搜索引擎相关算法的进步,使得有任何需求的用户都可通过搜索找到答案。其基本原理是给定搜索关键词×、y，搜索引擎返回包含x、y的网页数量f (x)、f(y)以及同时包含x和y的网页数量f(x, y)。

2022-07-24 18:07:24

赞同展开评论

问答分类：

数据挖掘 Python

问答标签：

Python文本 Python方法 Python计算 Python数据挖掘数据挖掘python

问答地址：

开发者社区 > 大数据 > 问答

相关问答

使用key通过 python下载数据列--请问具体是使用的哪个功能？

839

1

0

maxcomputer使用key通过 python下载数据列中文内容每次都是乱码需要解析，怎么解决？

842

1

0

dataworks python3节点返回数据后不能自动停止运行，请问如何处理？

978

1

0

我想问下 dataworks的 python节点能否直接读取holo上的表的数据

1245

1

0

python爬虫的方法有哪些？

931

0

0

python的学习方法有哪些

1486

2

0

python爬虫的好方法都有哪些

1073

0

0

请问表格储存中想问一下ots利用Python进行数据抽取，返回结果值为1，是什么原因造成的呢？

1124

1

0

Python 数据挖掘中，文本相似度计算方法中的其他方法又有哪些呢？

2983

1

0

Python 数据挖掘中，文本相似度计算里的本体是什么意思呢？

2957

1

0

问答排行榜

最热

最新

【大咖问答】对话PostgreSQL 中国社区发起人之一，阿里云数据库高级专家德哥

据说在家办公的程序员是这样写代码的？

如何升级配置

【藏经阁一起读（27）】本周推荐《Apache Flink案例集（2022版）》，你有哪些心得？

【精品问答】python技术1000问(1)

电脑下载有https证书问题，浏览器有时加载不出网页显示ERR_SSL_VERSION_OR_CIP

Qoder如何自主打开浏览器？

关于国际版和国内版客户端购买套餐问题

【Qoder CN】模型提供商：支持自定义第三方的URL

Pro试用版是只有300的Credits么？

相关文章

最新版大模型通义千问（Qwen3.7-Max）功能介绍

最新版通义千问（Qwen3.8-Max-Preview）功能介绍及使用指南

新版百炼Token Plan个人版全解：三档套餐权益、抵扣规则、模型适配实操指南

告别低效重复劳作！QoderWork全功能精通实操教程、场景用法、高阶技巧大全

还有其他疑问?