文档备案控制台

开发者社区问答正文

Python 数据挖掘中，基于词向量的短文本相似度的算法步骤是什么呢？

已解决

Python 数据挖掘中，基于词向量的短文本相似度的算法步骤是什么呢？

展开

收起

gxx1 2022-07-24 20:22:28 3129 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

gxx2

推荐回答

算法步骤是：将query中的每个词投射到Word Embedding空间，得到一团点云Q,将reference也同样投射成一团点云C，计算从Q到C的距离，作为WMD值，即两者的语义距离。

2022-07-24 20:27:39

赞同展开评论

问答分类：

算法数据挖掘 Python

问答标签：

算法步骤相似度算法数据挖掘步骤词向量算法短文本算法步骤

问答地址：

开发者社区 > 人工智能 > 问答

相关问答

机器学习PAI平台上的算法自定义，请帮忙看下有什么方式能解决这个问题？

270

1

0

机器学习PAI这个算法python版本的一直报错可以看一下吗？

250

0

0

dataworks 的算法节点有说明文档嘛，可以写python模型脚本嘛？

237

1

0

python做数据挖掘会不会有那种算法来的容易，效率却被降得很低的情况？

190

1

0

如果已经用其它语言实现了某一算法，还有必要用Python再实现一遍吗？

189

1

0

python的优势在于方法库很多，而且有很多方便的算法库。但直接调用是否反而会影响了自己算法的理解？

131

1

0

阿里云OpenAPI这块自行实现签名有提供对应python的签名算法么？

170

1

0

Holo或者Adb-Pg里没有（中文）文本相似度算法？

563

1

0

机器学习PAI-Designer算法组件自定义Python脚本组件不能保存提示文件上传失败

421

1

0

怎么用python机器学习的KNN算法实现对鸢尾花数据集的分类？求详细代码

881

1

0

问答排行榜

最热

最新

【大咖问答】对话PostgreSQL 中国社区发起人之一，阿里云数据库高级专家德哥

据说在家办公的程序员是这样写代码的？

如何升级配置

【藏经阁一起读（27）】本周推荐《Apache Flink案例集（2022版）》，你有哪些心得？

【精品问答】python技术1000问(1)

qoder cn里的DeepSeek-V4-Flash是0731发布的正式版吗?

qoder 不支持配置自定义第三方大模型api

关于credits购买机制

qoderWorkCn什么时候才能接入阿里云-百炼平台的token plan,自家套餐都没接入

程序员群体，大家都在用什么code plan方案？还有用的什么编码智能体？

相关文章

ComfyUI电脑版EXE文件下载、安装、配置、使用全流程图解，点击可直接运行

自变量开源 HOST 框架，让机器人看一条数十秒视频学会新技能，较主流方法提速 500 倍

【AI时代软件项目管理系列】1. AI 正在改变软件研发项目管理，而不只是改变写代码

外墙裂缝目标检测数据集：6,000+张图像 | 目标检测

让 Claude Code 少说废话、直接给答案——我试了这个 5200 Star 的技能包

还有其他疑问?