深度学习热点|超直观无公式图解Contrastive Predictive Coding从脸盲说起(二)

简介: 深度学习热点|超直观无公式图解Contrastive Predictive Coding从脸盲说起(二)

【重点来了】


那么怎么对比学习呢?


理想来说,你是一个阅剧无数的人,那么从这个电视剧后面的真实剧情 的感情走向 和你预测的感情走向 应该是极为相似的。


如果此时有人谈到另一个电视剧 (你看的电视剧叫 ) 的感情走向 ,那你一定能判断出他在谈的不是你在看的电视剧


可是如果你是一个小孩(初始化的神经网络,你可能就无法分辨不同剧的感情走向是不是对应的)


就像很多人模仿某作家的文风会被专业人士看出,却能欺骗过大众。


所以,正样本对和负样本对的定义是这样的:


66.png


(这里的k可以取1, 2, …, K), K是你认为最多能预测的timestep


那么网络到底是怎么进行学习的呢??


对不起,下面不得不有个公式:


定义对于单独一个样本j的NCE Loss:


77.png


这里f是一个相似度衡量函数,可以直接用exp(内积( ))。 (之所以不用MSE是因为CPC并不想要element wise的一致,而希望更全局的slowly changed 信息一致,希望mutual information一致)


这里分母的m=1,…, N 是采样的不是j的个体的embedding,通常取一个batch里的所有样本(包括样本j)。这样做比较方便写代码和计算。(不过Kaiming He最近有paper提出从batch之外采样效果更好。)


现在我们来看,对于牛逼的神经网络,分子的相似度应该很高,值会很大。


而分母的每一项,除了m=j的时候,其他项都应该非常小,甚至接近于0。


那么整个loss就会


而对于什么都不会的神经网络,假如是random guess,那么


88.png


所以,我们的只要minimize这个L,就是在优化这个神经网络,让它越来越能辨识正负样本对。


三、总结


这就是CPC的整个学习过程,通过这个正负样本对的loss来更新网络的所有参数。你可以理解为,逼着它更新特征提取器来学会辨识正负样本对。


更广一点contrastive learning的工作的思想也是这样的,只是正负样本对的构建方式不一样。


相关文章
|
机器学习/深度学习 搜索推荐 PyTorch
机器学习/深度学习中的常用损失函数公式、原理与代码实践(持续更新ing...)
本文的结构是首先介绍一些常见的损失函数,然后介绍一些个性化的损失函数实例。
机器学习/深度学习中的常用损失函数公式、原理与代码实践(持续更新ing...)
|
机器学习/深度学习
【深度学习】5-从计算图直观认识“激活函数不以零为中心导致收敛变慢”
【深度学习】5-从计算图直观认识“激活函数不以零为中心导致收敛变慢”
310 0
【深度学习】5-从计算图直观认识“激活函数不以零为中心导致收敛变慢”
|
机器学习/深度学习 自然语言处理 算法
深度学习Loss合集:一文详解Contrastive Loss/Ranking Loss/Triplet Loss等区别与联系
深度学习Loss合集:一文详解Contrastive Loss/Ranking Loss/Triplet Loss等区别与联系
1831 0
深度学习Loss合集:一文详解Contrastive Loss/Ranking Loss/Triplet Loss等区别与联系
|
机器学习/深度学习
深度学习热点|超直观无公式图解Contrastive Predictive Coding从脸盲说起(一)
深度学习热点|超直观无公式图解Contrastive Predictive Coding从脸盲说起(一)
242 0
深度学习热点|超直观无公式图解Contrastive Predictive Coding从脸盲说起(一)
|
机器学习/深度学习 算法 信息无障碍
深度学习中的Normalization模型(附实例&公式)
本文以非常宏大和透彻的视角分析了深度学习中的多种Normalization模型,从一个新的数学视角分析了BN算法为什么有效。
1432 0
|
10月前
|
机器学习/深度学习 运维 安全
深度学习在安全事件检测中的应用:守护数字世界的利器
深度学习在安全事件检测中的应用:守护数字世界的利器
359 22
|
7月前
|
机器学习/深度学习 编解码 人工智能
计算机视觉五大技术——深度学习在图像处理中的应用
深度学习利用多层神经网络实现人工智能,计算机视觉是其重要应用之一。图像分类通过卷积神经网络(CNN)判断图片类别,如“猫”或“狗”。目标检测不仅识别物体,还确定其位置,R-CNN系列模型逐步优化检测速度与精度。语义分割对图像每个像素分类,FCN开创像素级分类范式,DeepLab等进一步提升细节表现。实例分割结合目标检测与语义分割,Mask R-CNN实现精准实例区分。关键点检测用于人体姿态估计、人脸特征识别等,OpenPose和HRNet等技术推动该领域发展。这些方法在效率与准确性上不断进步,广泛应用于实际场景。
868 64
计算机视觉五大技术——深度学习在图像处理中的应用
|
11月前
|
机器学习/深度学习 传感器 数据采集
深度学习在故障检测中的应用:从理论到实践
深度学习在故障检测中的应用:从理论到实践
759 6
|
9月前
|
机器学习/深度学习 人工智能 运维
深度学习在流量监控中的革命性应用
深度学习在流量监控中的革命性应用
299 40
|
7月前
|
机器学习/深度学习 数据采集 存储
深度学习在DOM解析中的应用:自动识别页面关键内容区块
本文探讨了如何通过深度学习模型优化东方财富吧财经新闻爬虫的性能。针对网络请求、DOM解析与模型推理等瓶颈,采用代理复用、批量推理、多线程并发及模型量化等策略,将单页耗时从5秒优化至2秒,提升60%以上。代码示例涵盖代理配置、TFLite模型加载、批量预测及多线程抓取,确保高效稳定运行,为大规模数据采集提供参考。
151 0
下一篇
开通oss服务