ML之MLiR:输入两个向量,得出两个向量之间的相关度

简介: ML之MLiR:输入两个向量,得出两个向量之间的相关度

输出结果

image.png


实现代码

import numpy as np

from astropy.units import Ybarn

import math  

from statsmodels.graphics.tukeyplot import results

def computeCorrelation(X, Y):

   xBar = np.mean(X)

   yBar = np.mean(Y)

   SSR = 0          

   varX = 0

   varY = 0

   for i in range(0 , len(X)):  

       diffXXBar = X[i] - xBar  

       diffYYBar = Y[i] - yBar

       SSR += (diffXXBar * diffYYBar)

       varX +=  diffXXBar**2    

       varY += diffYYBar**2

 

   SST = math.sqrt(varX * varY)

   return SSR / SST

testX = [1, 3, 8, 7, 9]

testY = [10, 12, 24, 21, 34]

print ("r:",computeCorrelation(testX, testY))    

def polyfit(x,y,degree):

   results={}

 

   coeffs =np.polyfit(x,y,degree)  

   results['polynomial'] = coeffs.tolist()  

   p=np.poly1d(coeffs)                    

   yhat=p(x)                            

   ybar=np.sum(y)/len(y)                

   ssreg=np.sum((yhat-ybar)**2)      

   sstot=np.sum((y-ybar)**2)

   results['determination']=ssreg/sstot

 

   return results

print (polyfit(testX, testY, 1)["determination"])    


相关文章
|
机器学习/深度学习 算法 数据可视化
无监督学习的集成方法:相似性矩阵的聚类
在机器学习中,术语Ensemble指的是并行组合多个模型,这个想法是利用群体的智慧,在给出的最终答案上形成更好的共识。
202 0
|
1天前
|
算法 搜索推荐
解读双编码器和交叉编码器:信息检索中的向量表示与语义匹配
在信息检索领域(即从海量数据中查找相关信息),双编码器和交叉编码器是两种至关重要的工具。它们各自拥有独特的工作机制、优势和局限性。本文将深入探讨这两种核心技术。
10 3
解读双编码器和交叉编码器:信息检索中的向量表示与语义匹配
|
2月前
|
自然语言处理 数据挖掘
数据特征包括分布特征、统计特征、对比特征、帕累托特征和文本特征
数据特征包括分布特征、统计特征、对比特征、帕累托特征和文本特征
90 4
|
6月前
|
自然语言处理 Python
【Python自然语言处理】文本向量化的六种常见模型讲解(独热编码、词袋模型、词频-逆文档频率模型、N元模型、单词-向量模型、文档-向量模型)
【Python自然语言处理】文本向量化的六种常见模型讲解(独热编码、词袋模型、词频-逆文档频率模型、N元模型、单词-向量模型、文档-向量模型)
1017 0
|
5月前
7.处理多维特征的输入
7.处理多维特征的输入
|
6月前
|
算法
R语言随机搜索变量选择SSVS估计贝叶斯向量自回归(BVAR)模型
R语言随机搜索变量选择SSVS估计贝叶斯向量自回归(BVAR)模型
|
6月前
|
机器学习/深度学习 PyTorch 算法框架/工具
使用PyTorch处理多维特征输入的完美指南
使用PyTorch处理多维特征输入的完美指南
使用PyTorch处理多维特征输入的完美指南
|
机器学习/深度学习 PyTorch 算法框架/工具
使用Pytorch处理多维特征的输入
下图这个预测一个人在一年之后得糖尿病的概率的例子,这个时候我们的输入将会有很多的指标。你可以把它看成是我们体检的各种值。最后一排的外代表了他是否会得糖尿病。
179 0
|
存储 数据挖掘 vr&ar
R 数据集的概念、向量、矩阵和数组|学习笔记
快速学习 R 数据集的概念、向量、矩阵和数组。
220 0
R 数据集的概念、向量、矩阵和数组|学习笔记