深度学习热点|超直观无公式图解Contrastive Predictive Coding从脸盲说起(二)

简介: 深度学习热点|超直观无公式图解Contrastive Predictive Coding从脸盲说起(二)

【重点来了】


那么怎么对比学习呢?


理想来说,你是一个阅剧无数的人,那么从这个电视剧后面的真实剧情 的感情走向 和你预测的感情走向 应该是极为相似的。


如果此时有人谈到另一个电视剧 (你看的电视剧叫 ) 的感情走向 ,那你一定能判断出他在谈的不是你在看的电视剧


可是如果你是一个小孩(初始化的神经网络,你可能就无法分辨不同剧的感情走向是不是对应的)


就像很多人模仿某作家的文风会被专业人士看出,却能欺骗过大众。


所以,正样本对和负样本对的定义是这样的:


66.png


(这里的k可以取1, 2, …, K), K是你认为最多能预测的timestep


那么网络到底是怎么进行学习的呢??


对不起,下面不得不有个公式:


定义对于单独一个样本j的NCE Loss:


77.png


这里f是一个相似度衡量函数,可以直接用exp(内积( ))。 (之所以不用MSE是因为CPC并不想要element wise的一致,而希望更全局的slowly changed 信息一致,希望mutual information一致)


这里分母的m=1,…, N 是采样的不是j的个体的embedding,通常取一个batch里的所有样本(包括样本j)。这样做比较方便写代码和计算。(不过Kaiming He最近有paper提出从batch之外采样效果更好。)


现在我们来看,对于牛逼的神经网络,分子的相似度应该很高,值会很大。


而分母的每一项,除了m=j的时候,其他项都应该非常小,甚至接近于0。


那么整个loss就会


而对于什么都不会的神经网络,假如是random guess,那么


88.png


所以,我们的只要minimize这个L,就是在优化这个神经网络,让它越来越能辨识正负样本对。


三、总结


这就是CPC的整个学习过程,通过这个正负样本对的loss来更新网络的所有参数。你可以理解为,逼着它更新特征提取器来学会辨识正负样本对。


更广一点contrastive learning的工作的思想也是这样的,只是正负样本对的构建方式不一样。


相关文章
|
机器学习/深度学习 搜索推荐 PyTorch
机器学习/深度学习中的常用损失函数公式、原理与代码实践(持续更新ing...)
本文的结构是首先介绍一些常见的损失函数,然后介绍一些个性化的损失函数实例。
机器学习/深度学习中的常用损失函数公式、原理与代码实践(持续更新ing...)
|
机器学习/深度学习
【深度学习】5-从计算图直观认识“激活函数不以零为中心导致收敛变慢”
【深度学习】5-从计算图直观认识“激活函数不以零为中心导致收敛变慢”
213 0
【深度学习】5-从计算图直观认识“激活函数不以零为中心导致收敛变慢”
|
机器学习/深度学习 自然语言处理 算法
深度学习Loss合集:一文详解Contrastive Loss/Ranking Loss/Triplet Loss等区别与联系
深度学习Loss合集:一文详解Contrastive Loss/Ranking Loss/Triplet Loss等区别与联系
1546 0
深度学习Loss合集:一文详解Contrastive Loss/Ranking Loss/Triplet Loss等区别与联系
|
机器学习/深度学习
深度学习热点|超直观无公式图解Contrastive Predictive Coding从脸盲说起(一)
深度学习热点|超直观无公式图解Contrastive Predictive Coding从脸盲说起(一)
179 0
深度学习热点|超直观无公式图解Contrastive Predictive Coding从脸盲说起(一)
|
机器学习/深度学习 算法 信息无障碍
深度学习中的Normalization模型(附实例&公式)
本文以非常宏大和透彻的视角分析了深度学习中的多种Normalization模型,从一个新的数学视角分析了BN算法为什么有效。
1272 0
|
8天前
|
机器学习/深度学习 人工智能 算法
深度学习在图像识别中的应用与挑战
本文探讨了深度学习技术在图像识别领域的应用,重点分析了卷积神经网络(CNN)的工作原理及其在处理图像数据方面的优势。通过案例研究,展示了深度学习如何提高图像识别的准确性和效率。同时,文章也讨论了当前面临的主要挑战,包括数据不足、过拟合问题以及计算资源的需求,并提出了相应的解决策略。
|
3天前
|
机器学习/深度学习 人工智能 自然语言处理
深度学习中的卷积神经网络(CNN)及其在图像识别中的应用
本文旨在通过深入浅出的方式,为读者揭示卷积神经网络(CNN)的神秘面纱,并展示其在图像识别领域的实际应用。我们将从CNN的基本概念出发,逐步深入到网络结构、工作原理以及训练过程,最后通过一个实际的代码示例,带领读者体验CNN的强大功能。无论你是深度学习的初学者,还是希望进一步了解CNN的专业人士,这篇文章都将为你提供有价值的信息和启发。
|
3天前
|
机器学习/深度学习 数据采集 测试技术
深度学习在图像识别中的应用
本篇文章将探讨深度学习在图像识别中的应用。我们将介绍深度学习的基本原理,以及如何使用深度学习进行图像识别。我们将通过一个简单的代码示例来演示如何使用深度学习进行图像识别。这篇文章的目的是帮助读者理解深度学习在图像识别中的作用,并学习如何使用深度学习进行图像识别。
|
4天前
|
机器学习/深度学习 算法框架/工具 Python
深度学习在图像识别中的应用
本文将探讨深度学习技术在图像识别领域的应用。我们将介绍深度学习的基本原理,以及如何使用深度学习进行图像识别。我们还将通过一个简单的代码示例来演示如何使用深度学习进行图像识别。
|
3天前
|
机器学习/深度学习 数据采集 边缘计算
深度学习在图像识别中的应用与挑战
本文深入探讨了深度学习在图像识别领域的应用,并分析了当前面临的主要挑战。通过具体案例和数据分析,展示了深度学习技术如何推动图像识别的边界,同时指出了数据质量、模型泛化能力及计算资源等方面的限制因素。文章旨在为研究人员和从业者提供一个关于深度学习在图像识别中应用现状与未来发展方向的全面视角。

热门文章

最新文章