向量检索/向量相似性计算方法(持续更新ing...)

简介: 本文介绍各种用于向量检索的向量相似性计算方法,将会简单介绍各种方法的优缺点等信息,并用toy example给出代码示例。

1. 余弦相似度


使用sklearn.metrics.pairwise.cosine_similarity实现。

最终得到的值会在[-1,1]之间。


API官方文档:sklearn.metrics.pairwise.cosine_similarity — scikit-learn 1.1.2 documentation

对计算公式的介绍:https://scikit-learn.org/stable/modules/metrics.html#cosine-similarity


计算公式:

image.png


计算一组向量之间的两两相似度,代码撰写方法:


from sklearn.metrics.pairwise import cosine_similarity
cos_sim_matrix = cosine_similarity(train_feature)
#入参是一个二维矩阵,每行是一个样本特征


2. 线性核(点积)


2.1 sklearn实现

使用sklearn.metrics.pairwise.linear_kernel实现。


API官方文档:sklearn.metrics.pairwise.linear_kernel — scikit-learn 1.1.2 documentation


计算公式:

image.png

相关文章
|
机器学习/深度学习 算法 搜索推荐
高维向量检索的设计与实践(一)|学习笔记
快速学习高维向量检索的设计与实践(一)
300 0
高维向量检索的设计与实践(一)|学习笔记
|
存储 算法 数据挖掘
高维向量检索的设计与实践(三)|学习笔记
快速学习高维向量检索的设计与实践(三)
220 0
高维向量检索的设计与实践(三)|学习笔记
|
存储 SQL 算法
高维向量检索的设计与实践(二)|学习笔记
快速学习高维向量检索的设计与实践(二)
328 0
高维向量检索的设计与实践(二)|学习笔记
|
BI 数据库 开发者
高维向量检索的设计与实践|学习笔记
快速学习高维向量检索的设计与实践
140 0
高维向量检索的设计与实践|学习笔记
ML之MLiR:输入两个向量,得出两个向量之间的相关度
ML之MLiR:输入两个向量,得出两个向量之间的相关度
ML之MLiR:输入两个向量,得出两个向量之间的相关度
|
机器学习/深度学习
白话向量点积
点积(Dot Product)是机器学习中最常见的向量操作。本文将通过简洁易懂的语言配合大量图形为大家介绍点积运算及其背后的数学意义。
325 0
|
算法
白话Elasticsearch26-深度探秘搜索技术之function_score自定义相关度分数算法
白话Elasticsearch26-深度探秘搜索技术之function_score自定义相关度分数算法
141 0
向量基础
a·b=|a||b|cosθ=axbx+ayby a×b=|a||b|sinθ=axby-bxay=平行四边形面积
761 0

热门文章

最新文章