一文概述联邦持续学习最新研究进展(2)

本文涉及的产品
传统型负载均衡 CLB,每月750个小时 15LCU
网络型负载均衡 NLB,每月750个小时 15LCU
应用型负载均衡 ALB,每月750个小时 15LCU
简介: 一文概述联邦持续学习最新研究进展

3、Federated Class Incremental Learning



3.1 本地灾难性遗忘补偿


通过在分散的客户端上进行数据私有的协作训练,联邦学习吸引了越来越多的关注。然而,大多数现有的方法假设整体框架的对象类别是固定的。这使得全局模型在现实世界的场景中遭受了严重的灾难性遗忘,因为本地客户端经常不断地收集新的类别,而用于存储旧的类别的存储空间非常有限。此外,存有之前未见过的新类别数据的新客户端可能参与 FL 训练,这就进一步加剧了全局模型的灾难性遗忘。为了应对这些挑战,本文提出了一个新的全局 - 本地遗忘补偿(Global-Local Forgetting Compensation,GLFC)模型,从本地和全局的角度学习一个全局类别增量模型来缓解灾难性遗忘。作者表示,这是第一次尝试在 FL 设置中学习全局类增量模型(a global class-incremental model)。具体来说,为了解决本地客户端的类别不平衡引起的本地遗忘,作者设计了一个类别意识的梯度补偿损失和一个类别语义关系蒸馏损失,以平衡旧类别的遗忘,并在不同任务中蒸馏出一致的类间关系。为了解决 non-i.i.d 类不平衡带来的全局遗忘问题,作者提出了一个代理服务器,选择最佳的旧全局模型来协助本地关系蒸馏。考虑到隐私保护,代理服务器通过基于原型梯度的通信机制从本地客户端收集新类的扰动原型样本,然后利用它们来监测全局模型的性能以选择最佳模型。本文模型在代表性的基准数据集上的平均准确率比 SOTA 方法高出 4.4%∼15.1%。代码已公布在 https://github.com/conditionWang/FCIL


图 5 描述了本文模型的概况。为了满足 FCIL 的要求,本文模型通过类别意识梯度补偿损失和类别语义关系蒸馏损失来解决本地遗忘问题,同时通过代理服务器为本地客户端选择最佳旧模型来解决全局遗忘问题。


图 5. GLFC 模型概述。它主要由类别意识梯度补偿损失 L_GC 和类别语义关系蒸馏损失 L_RD 组成,以克服本地的类别不平衡造成的本地灾难性遗忘。使用代理服务器 S_P 来解决 non-ii.d. 类别不平衡带来的跨客户端的全局灾难性遗忘,其中 S_P 和客户端之间开发了一个原型梯度通信机制用于私人通信,同时为 L_RD 选择最佳旧的全局模型


在第 t 个增量任务中,给定第 l 个本地客户端 S_l∈S_b 的新类别训练数据和样本存储器 M_l,minibatch 的分类损失 L_CE 为:


(1)


其中,b 是批次大小,Θ_r,t 是第 r 轮全局任务的分类模型,由中央服务器传送给本地客户端。P^t_l (x_t^(l_i, Θ_r,t) ∈R^(C^p+C^t)表示通过 Θ_r,t 预测的 sigmoid 概率,DCE (・,・) 是二元交叉熵损失。


如前所述,新旧类别(T^t_l 和 M_l)本地不平衡,使得本地训练在旧的类别上出现了明显的性能下降(即本地灾难性遗忘)。为了防止本地遗忘,如图 5 所示,本文为本地客户端开发了一个类别意识的梯度补偿损失和一个类别语义关系蒸馏损失,它可以纠正不平衡的梯度传播并确保跨增量任务的类别间语义一致性。


  • 类别感知梯度补偿损失:在 S_G 将 Θ^r,t 分布到本地客户端后,本地客户端的类别不平衡分布导致 Θ^r,t 中最后输出层的梯度反向传播不平衡。它使得本地模型 Θ^r,t_l 的更新在本地训练后,在新的类别中执行不同的 learning paces,在旧的类别中执行不同的 forgetting paces。当新的流媒体数据不断成为旧的类别的一部分时,这种现象严重恶化了对旧类别的本地遗忘。


对应于此问题,本文设计了一个类别意识梯度补偿损失 L_GC,通过重新加权梯度传播,分别对新类别的学习速度和旧类别的遗忘速度进行规范。具体来说,对于单个样本(x^t_li, y^t_li),我们得到一个相对于 Θ^r,t_l 中最后输出层的第 y^t_li 个神经元的梯度测量 G^t_li:


(2)


为了使新类别的学习速度和旧类别的遗忘速度正常化,我们对新旧类别分别进行梯度规范化处理,并利用它来重估 L_CE。给定一个小批次 {x^t_li, y^t_li},定义如下:


(3)


作为新旧两类别的梯度手段,其中 I (・) 是指标函数,如果下标条件为真,I (True)=1;否则,I (False)=0。因此,重新加权的 L_CE 损失表述如下:


(4)


  • 类别 - 语义关系蒸馏损失。在初始化为当前全局模型 Θ^r,t 的本地模型 Θ^r,t_l 的训练过程中,Θ^r,t_l 预测的概率表示类间语义相似关系。为了确保不同增量任务之间的类间语义一致性,作者通过考虑新旧类之间的基本关系,设计了一个类别 - 语义关系蒸馏损失 L_RD。如图 5 所示,分别将一个小批次的数据集 {X^t_lb, Y^t_lb} 转发到存储的旧模型 Θ^t-1_l 和当前的本地模型 Θ^r,t_l。这些概率反映了新旧两类之间的类间关系。与现有的知识蒸馏策略不同的是,作者通过优化 L_RD 同时考虑了新旧类之间的类间关系,只保证旧类在 Θ^t-1_l 和 Θ^r,t_l 之间的语义一致性。也就是说,利用独热编码标签 Y^t_lb 的一个变体,用 P^t-1_l (X^t_lb, Θ^t-1_l) 代替 Y^t_lb 的第一个 C^p 维度,并将这个变体表示为:



由此得到 L_RD 如下:


(5)


总的来说,第 l 个本地客户端的优化目标为:

(6)


  • 任务转移检测。在 FCIL 中,我们没有关于本地客户端何时收到新类数据的先验知识。为了解决这个问题,作者考虑一个解决方案:识别训练数据的标签以前是否被观察到过。然而,由于类别分布的 non-i.i.d. 设置,这种方法不能确定新收到的标签是来自新的类别还是其他本地客户端观察到的旧的类别。另一个直观的解决方案是使用性能下降作为收集新类的信号。这种解决方案在 FCIL 中是不可行的,因为随机选择 {So, Sb, Sn} 和它们的 non-i.i.d. 类分布会导致性能急剧下降,即使没有收到新的类。为此,作者提出了一种任务转移检测机制,以准确识别本地客户端何时收到新的类别。具体来说,在第 r 个全局轮次,每个客户端通过收到的全局模型 Θ^r,t 对其当前训练数据 T^t_l 计算平均熵 H^r,t_l:

    (7)


3.2 全局灾难性遗忘补偿


虽然公式(6)可以解决本地的类别不平衡带来的本地灾难性遗忘,但它不能解决来自其他客户端的异质性遗忘(即全局灾难性遗忘)。换句话说,non-i.i.d. 类的不平衡分布在本地客户端上导致了某些旧类的全局灾难性遗忘,进一步恶化了本地灾难性遗忘。因此,有必要从全局角度解决不同客户端的异质性遗忘问题。如前所述,公式(5)中提出的类别 - 语义关系蒸馏损失 L_RD 需要存储以前任务的旧分类模型 Θ^t-1_l 来提炼类间关系。一个较好的 Θ^t-1_l 可以在全局上增加以前任务的蒸馏收益,从全局上加强对旧类的记忆。因此,Θ^t-1_l 的选择在全局灾难性遗忘补偿中起着重要作用,应从全局角度考虑。


然而在 FCIL 中,由于隐私保护很难选择最佳 Θ^t-1_l。直观的解决方案是,每个客户端在第(t-1)个任务期间用训练数据 T^t-1_l 存储其最佳旧模型 {Θ^t-1_l}。不幸的是,这个解决方案是从本地角度考虑选择 Θ^t-1_l 的,不能保证所选择的 Θ^t-1_l 对所有的旧类都有最好的记忆,因为每个本地客户端只有一个旧类子集(non-i.i.d)。为此,作者引入一个代理服务器 S_P,从全局角度为所有客户端选择最佳的 Θ^t-1,如图 5 所描述。具体来说,当本地客户端通过任务转换检测在第 t 个任务开始时识别了新的类(即 T^t_l),他们将通过基于原型梯度的通信机制将新类的扰动原型样本传送给 S_P。在收到这些梯度后,S_P 重建被扰动的原型样本,并利用它们来监测全局模型 Θ^r,t(从 S_G 收到)的性能,直到找到最佳模型。当步入下一个任务(t+1)时,S_P 将最优 Θ^r,t 分发给本地客户端,本地客户端将其视为最优旧模型来执行 L_RD。


  • 基于梯度的原型通信。给定第 l 个本地客户端 Sl∈Sb∪Sn,该客户端收到训练数据 T^t_ l 的新类,Sl 通过任务转换 detention 来识别新的类。然后 Sl 从 T^t_l 中为每个新的类(c = C^p_l + 1, - -, C^p_l +C^t_l)只选择一个有代表性的原型样本 x^t_lc∗,其中 x^t_lc∗的特征最接近属于 c 类的所有样本在潜在特征空间的平均嵌入。然后将这些原型样本和它们的标签送入 L 层梯度编码网络 Γ = {Wi},计算梯度∇Γ_lc。S_P 随机处理所有从本轮全局的选定客户端处收到的梯度,以构建一个梯度池,假设这个池子里有 N^t_g 个梯度。这种操作可以防止 S_P 通过注释特殊的梯度分布来追踪某些选定的客户端。对于∇Γ^t 的第 n 个元素∇Γ^t_n,我们可以通过观察∇Γ 中最后一层的梯度符号来获得其对应的 ground-truth 标签 y^t_n(有一个独热编码标签 y^t_n)。给定一个由标准高斯 (N0,1) 初始化的假样本 x¯^t_n,将所有的 {x¯^t_n, ∇Γ^t_n, y^t_n} 对转发到 Γ = {Wi},该网络与本地客户端使用的梯度编码网络相同,以恢复每个新类的原型样本。重建损失 L_RT 如下:

    (8、9)


  • 最优旧模型的选择。当检测到新的类时,S_P 只能在第 t 个任务的第一轮接收本地客户端的梯度。然后,S_P 通过优化公式(9)重建 N^t_g 个新类别的原型样本及其标签(即 {x¯^t_n, y^t_n})。在第 t 个任务中,S_P 将这些重建的样本转发到全局模型 Θ^r,t(从 S_G 处收到),通过评估哪个模型具有最佳精度来选择最佳 Θ^t,直到收到下一个任务的新类的梯度。在从第二个任务开始的每一轮全局处理过程中,S_P 将上一个任务和当前任务的最优模型(即 Θ^t-1 和 Θ^t),分配给所有被选中的客户端。如果这些被选中的客户端在第 t 个任务中检测到 T^t+1_l 的新类,他们将把 Θ^t 设置为旧模型 Θ^t-1_l,否则,将 Θ^t-1 设置为 Θ^t-1_l 来执行 L_RD。


  • 扰动的原型样本构建。尽管网络 Γ 只有 S_P 和本地客户端可以私下访问,但恶意攻击者可以窃取 Γ 和这些梯度来重建第 l 个本地客户端的原始原型样本 {x^t_lc∗ , y^t_lc∗ }。为了实现隐私保护,作者建议在这些原型样本中加入扰动。攻击者即使能重建原型样本,也只能从扰动的原型样本中获得很少的有用信息。给定一个原型样本 {x^t_lc∗ , y^t_lc∗ },将其转入通过公式(6)训练的本地模型 Θ^r,t_l,并应用反向传播来更新这个样本。为了产生扰动的原型样本,作者在原型样本的潜在特征中引入一个高斯噪声,然后通过公式(11)更新 x^t_lc∗:



    (10)

                                                                            (11)


其中,Φ(x^t_lc∗) 表示 x^t_lc∗的潜在特征,P^t_l (Φ(x^t_lc∗)+γN (0, σ2), Θ^r,t_l) 是在 Φ(x^t_lc∗) 中加入高斯噪声 N (0, σ2) 时通过 Θ^r,t_l 预测的概率。σ2 代表属于 y^t_lc∗的所有样本的特征方差,作者根据经验设定 γ=0.1,以控制本文中高斯噪声的影响。图 6 展示了一些重建的原型样本。


图 6. CIFAR-100 中原始原型样本(上行)、扰动原型样本(中行)和通过代理服务器重建的原型样本(下行)的可视化情况


3.3 实验情况介绍


本文在 CIFAR-100、ImageNetSubset 和 TinyImageNet 上进行实验,对比实验结果如表 3-5。其中,△表示本文模型与其他比较方法相比的改进。我们观察到,在 FCIL 设置中,本文模型以 4.4%~15.1% 的幅度超过了现有的 class-incremental 方法的平均精度。这验证了本文模型可以使本地客户端协同训练一个全局的 class-incremental 模型。此外,与其他方法相比,本文模型在所有增量任务中都有稳定的性能提升,这验证了本文模型在解决 FCIL 中遗忘问题的有效性。


表 3. 本文模型和其他基线方法在 CIFAR-100 上的性能比较


表 4. 本文模型和其他基线方法在 ImageNet-Subset 上的性能比较


表 5. TinyImageNet 上前 10 个任务与 20 个任务的比较


此外,作者对基准数据集上的各种增量任务(T=5、10、20)进行定性分析,以验证 GLFC 的性能。根据这些曲线,我们可以很容易地观察到,在不同的任务数量(T=5,10,20)的设置下,我们的模型在所有的增量任务中都比其他基线方法表现更好。这表明 GLFC 模型能够使多个本地客户端以流式方式学习新的类,同时解决本地和全局遗忘问题。如图 7、8 所示。


图 7. T=5(左)、T=10(中)和 T=20(右)时,对 CIFAR-100 上不同增量任务的定性分析


图 8. T=5(左)、T=10(中)和 T=20(右)时,ImageNet-Subset 上增量任务的定性分析


4、Learn from Others and Be Yourself in Heterogeneous Federated Learning



联邦学习已经成为一种重要的分布式学习范式,它通常涉及与他人的协作更新和私有数据的本地更新。然而,异质性问题和灾难性遗忘给联邦学习带来了挑战。首先,由于 non-i.i.d 数据和异质结构,模型在其他域的性能下降,并与参与者的模型存在沟通障碍。其次,在本地更新中模型是在私有数据上单独优化的,这很容易过度拟合当前的数据分布,忘记以前获得的知识,导致灾难性的遗忘。本文提出了联邦交叉相关和持续学习(Federated Cross-Correlation and Continual Learning,FCCL)。对于异质性问题,FCCL 利用未标记的公共数据进行通信,并构建交叉相关矩阵来学习域偏移的可泛化表示。同时,对于灾难性遗忘,FCCL 利用本地更新中的知识提炼,在不泄露隐私的情况下提供域间和域内信息。作者通过各种图像分类任务的实证结果证明了本文方法的有效性和模块的效率。


按照标准的联邦学习设置,有 K 个参与者(以 i 为索引),每个参与者都有一个本地模型 θ_i 和私有数据 D_i = {(X_i,Y_i)|X_i∈R^(Ni×D), Y_i∈R^(Ni×C) },其中,N_i 表示私有数据的数量,D 表示输入大小,C 定义为分类的类别数量。同时,私有数据分布表示为 P_i (X, Y),并改写为 P_i (X|Y ) P_i (Y)。此外,在异质联邦学习中,数据的异质性和模型的异质性定义如下:


  • 数据的异质性。P_i (X|Y )≠P_j (X|Y )。私有数据之间存在域偏移,即私有数据的条件分布 P (X|Y) 在不同的参与者中是不同的,即使 P (Y) 是共享的。具体来说,同一个标签 Y 在不同域有不同的特征 X。
  • 模型的异质性:Shape (θ_i) ≠ Shape (θ_j )。参与者独立定制模型,即对于分类任务,所选择的骨干网(如 ResNet、EfficientNet 和 MobileNet)是不同的,具有不同的分类器模型。


作者利用无标签的公共数据 D_0={X_0|X_0∈R^(N0×D)} 来实现通信。公共数据在实际场景中相对容易获取。第一名参与者的目标是达成沟通,并学习具有可概括性的模型 θ_i。此外,考虑到灾难性的问题,θ_k 需要呈现更高更稳定的域间和域内性能。本文方法的框架如图 9 所示。具体来说,在协作更新中,作者测量未标记的公共数据上输出的 Logits 之间的交叉相关矩阵,以实现相似性和减少冗余。同时,在本地更新中,通过知识蒸馏不断平衡多域的信息。


图 9. FCCL 示例。(a) 本文方法的简化示意图,该方法通过联邦交叉相关学习和联邦持续学习解决了异质性问题和灾难性遗忘;(b) 联邦交叉相关学习;(c) 联邦持续学习。梯度颜色比例反映了其他参与者的影响程度


4.1 联邦交叉相关学习


维度级(Dimension-Level)操作的启发。受信息瓶颈进行自监督学习的成功经验启发,作者提出:一个可概括的表征应该尽可能地提供关于图像的信息,同时尽可能地对应用于该样本的特定域的变换不产生影响。在本文工作中,域偏移导致同一标签 Y 在不同域有不同的特征 X。因此,不同域的 logits 输出沿批次维度的分布是不一样的。此外,不同维度的 logits 输出对应着不同的类别。因此,我们需要鼓励相同维度的不变性和不同维度的多样性。私有数据带有特定的域信息,并且受到隐私保护,这对于进行自监督学习是不合适的,也是不可行的。因此,我们利用未标记的公共数据,这些数据通常是从多个域产生和收集的,而且很容易获得。我们通过要求 logits 输出不受域偏移的影响,以及在无标签的公共数据上对 logits 输出的不同维度进行修饰来优化私有模型。


交叉相关矩阵的构建。具体来说,我们得到第 i 个参与者的 logits 输出。Z_i =f (θ_i, X_0) ∈R^(N_0×C) 。对于第 i 个和第 j 个参与者,在未标记的公共数据上的 logits 输出为 Z_i 和 Z_j。值得注意的是,考虑到中央服务器端的计算负担,我们计算 average Logits 输出:



然后,计算交叉相关矩阵,第 i 个参与者的 average logits 输出为 M_i:


(12)


其中,b 指的是批次样本,u、v 指的是 logits 输出的维度,||・|| 是沿批次维度进行的归一化操作。M_i 是一个正方形矩阵,大小为输出维度 C,数值在 - 1(即不相似)和 1(即相似)之间。那么,第 i 个参与者的协作损失定义为:

                                           

(13)


其中,λ_Col 是一个正常数,用来权衡损失的第一项和第二项的重要性。当交叉相关矩阵的对角线项取值为 + 1 时,它鼓励不同参与者的 logits 输出相似。当交叉相关矩阵的对角线项取值为 - 1 时,它鼓励 logits 输出的多样性,因为这些 logits 输出的不同维度是彼此不相关的。


4.2 联邦持续相关学习


典型的监督损失。对于联邦学习中的本地更新,目前的方法通常将这个过程作为一个监督分类问题。具体来说,在第 t 轮通信中,协作更新后,将第 i 个私有模型定义为 (θ^t,im)_i。然后,在固定 epoch 的私有数据 D_i (X_i, Y_i) 上优化 (θ^t,im)_i。给定如下 logits 输出:



用 softmax 对交叉熵损失进行优化:


(14)



这样的训练目标设计可能会面临灾难性遗忘的问题,主要是由于以下两个限制:1)在本地更新中,如果没有其他参与者的监督,模型很容易过度拟合当前的数据分布,呈现出糟糕的域间性能。2)它只对预测进行独立的先验概率惩罚,这提供了有限的和 hard 的域内信息。


双域知识蒸馏损失。作者开发了一种联邦持续学习方法,通过从模型方面对目标进行正则化来解决 1)和 2)的问题。具体来说,在第 t-1 轮训练结束时,更新的模型 (θ^t-1)_i 包含了从其他参与者学到的知识。在私有数据上计算 logits 输出如下:



域内知识蒸馏的损失定义为:


(15)


其中,σ 表示 softmax 函数。如公式(15),其目的是在保护隐私的同时不断向他人学习,从而保证域间性能,并处理联邦学习中的灾难性遗忘问题。此外,对于第 i 个参与者,在私有数据上预训练一个模型 (θ^∗)_i 是可行的。给定如下私有数据:



域内知识蒸馏损失定义为:


(16)


带有预训练模型的知识蒸馏提供了 soft 而丰富的域内信息。此外,它与公式(14)中的典型监督损失(即交叉熵损失)合作,提供 soft 和 hard 的域内信息以确保域内性能。在某种程度上,上述两个模型(即更新的模型 (θ^t-1)_i 和预训练的模型 (θ^∗)_i)分别代表了 "教师" 之间和内部的模型。通过知识蒸馏,平衡来自他人和自身的知识,同时提升了域间和域内的性能。双域知识蒸馏的计算方法为:


(17)


公式(14)中的典型监督损失和公式(17)中的双域知识蒸馏损失是相互补充的。前者要求模型学习对分类任务有意义的鉴别性表征,而后者则有助于用域内和域间的 soft 丰富信息使模型规范化。因此,总的训练目标是:



完整的 FCCL 流程如下:



4.3 实验情况介绍


作者在两个分类任务(如 Digits 和 Office-Home)和三个公共数据集(如 Cifar-100、ImageNet 和 Fashion-MNIST)上广泛地评估了本文方法。具体来说,Digits 任务包括四个域(MNIST(M)、USPS(U)、SVHN(SV)和 SYN(SY)),共有 10 个类别。Office-Home 任务也有四个域(艺术(A)、剪贴画(C)、产品(P)和现实世界(R))。请注意,对于这两项任务来说,从不同域获得的数据呈现出域偏移(数据异质性)特性。对于这两个分类任务,参与者定制的模型可以从差异化的骨干网和分类器中获得差异(模型异质性)。在实验中,作者将这四个域的模型设置为 ResNet、EfficientNet、MobileNet 和 GoogLeNet。作者将 FCCL 与最先进的方法,包括 FedDF、FML、FedMD、RCFL 和 FedMatch,进行比较。此外,还比较了 SOLO,即参与者在没有联邦学习的情况下在私有数据上训练一个模型。由于具体的实验设置并不完全一致,作者保留了一些方法的关键特征进行比较。


评价指标。作者报告了衡量方法质量的标准指标:准确性,将其定义为成对的样本数除以样本数。具体来说,为了评价域内和域间的性能,定义如下指标:



域间分析。表 6 报告了不同方法的域间性能。在域偏移的情况下,SOLO 在这两个任务中表现得最差。我们观察到,FCCL 的表现明显优于其他同类方法。图 10 显示,FCCL 在参与者之间实现了相似的 logits 输出,并在 logits 输出中实现了冗余,这证实了 FCCL 在公共和私有数据上成功地执行了相同维度的相关性和不同维度的去相关性。


表 6. 域间性能与最先进方法的比较。M→表示私有数据是 MNIST,各自的模型在其他域测试。AVG 表示从每个域计算出的平均精度


图 10. 用 Cifar-100 对不同域的数字任务进行交叉相关矩阵的可视化分析


域内分析。为了比较缓解灾难性遗忘的效果,表 7 报告了不同方法的域内性能。以 Cifar-100 的 Digits 任务为例,本文方法比 RCFL 要好 2.30%。此外,图 11a 中通过增加通信轮次的域内精度和图 11b 中的优化目标值表明,FCCL 受到的周期性性能冲击较小,而且不容易对当前的数据分布进行过拟合(L^Loc=0.0225),说明 FCCL 能够平衡多种知识,缓解灾难性遗忘。


表 7. 用 Cifar-100 在这两项任务上与最先进的方法进行域内性能比较


图 11. 用 Cifar-100 通过增加通信轮次对数字任务进行本地更新时的域内性能和优化目标值的比较


模型同质性分析。作者进一步将 FCCL 与其他方法进行模型同质性比较。将共享模型设定为 ResNet-18,并在协作更新和本地更新之间添加平均参数操作。表 8 列出了域间和域内的数据,展示了 Cifar-100 在 Office-Home 任务中的域间和域内性能。


表 8. 用 Cifar-100 在 Office-Home 任务中与最先进的方法进行比较

相关实践学习
SLB负载均衡实践
本场景通过使用阿里云负载均衡 SLB 以及对负载均衡 SLB 后端服务器 ECS 的权重进行修改,快速解决服务器响应速度慢的问题
负载均衡入门与产品使用指南
负载均衡(Server Load Balancer)是对多台云服务器进行流量分发的负载均衡服务,可以通过流量分发扩展应用系统对外的服务能力,通过消除单点故障提升应用系统的可用性。 本课程主要介绍负载均衡的相关技术以及阿里云负载均衡产品的使用方法。
相关文章
|
7月前
|
机器学习/深度学习 分布式计算 算法
联邦学习是保障数据隐私的分布式机器学习方法
【6月更文挑战第13天】联邦学习是保障数据隐私的分布式机器学习方法,它在不暴露数据的情况下,通过在各设备上本地训练并由中心服务器协调,实现全局模型构建。联邦学习的优势在于保护隐私、提高训练效率和增强模型泛化。已应用于医疗、金融和物联网等领域。未来趋势包括更高效的数据隐私保护、提升可解释性和可靠性,以及与其他技术融合,有望在更多场景发挥潜力,推动机器学习发展。
135 4
|
8月前
|
机器学习/深度学习 人工智能 并行计算
人工智能平台PAI产品使用合集之机器学习PAI中特征重要性的原理不知道如何解决
阿里云人工智能平台PAI是一个功能强大、易于使用的AI开发平台,旨在降低AI开发门槛,加速创新,助力企业和开发者高效构建、部署和管理人工智能应用。其中包含了一系列相互协同的产品与服务,共同构成一个完整的人工智能开发与应用生态系统。以下是对PAI产品使用合集的概述,涵盖数据处理、模型开发、训练加速、模型部署及管理等多个环节。
|
5月前
|
机器学习/深度学习 数据采集 人工智能
理解并应用机器学习算法:从技术基础到实践应用
【8月更文挑战第10天】机器学习算法的应用已经深入到我们生活的方方面面,理解和掌握机器学习算法对于数据科学家、工程师乃至普通从业者来说都至关重要。通过本文的介绍,希望大家能够对机器学习有一个基本的认识,并学会如何将其应用于实际问题中。当然,机器学习是一个不断发展和演变的领域,只有不断学习和实践,才能跟上时代的步伐。
|
7月前
|
机器学习/深度学习 人工智能 自然语言处理
AI大模型学习涉及理论、技术和应用多个方面的探索
AI大模型学习涉及理论、技术和应用多个方面的探索
89 3
|
7月前
|
机器学习/深度学习 数据采集 算法
机器学习入门:算法与数据的探索之旅
【6月更文挑战第13天】本文介绍了机器学习的基础,包括算法和数据处理的重要性。机器学习算法分为监督学习(如线性回归、决策树)、非监督学习(如聚类、降维)和强化学习。数据处理涉及数据清洗、特征工程、数据分割及标准化,是保证模型性能的关键。对于初学者,建议学习基础数学、动手实践、阅读经典资料和参与在线课程与社区讨论。
|
7月前
|
机器学习/深度学习 人工智能 算法
【机器学习】AI在空战决策中的崛起:从理论到实践的跨越
【机器学习】AI在空战决策中的崛起:从理论到实践的跨越
205 0
|
8月前
|
人工智能 自然语言处理 自动驾驶
大模型领域急需建立可解释AI理论
【1月更文挑战第21天】大模型领域急需建立可解释AI理论
59 2
大模型领域急需建立可解释AI理论
|
存储 机器学习/深度学习 算法
一文概述联邦持续学习最新研究进展(3)
一文概述联邦持续学习最新研究进展
520 0
一文概述联邦持续学习最新研究进展(3)
|
机器学习/深度学习 存储 人工智能
一文概述联邦持续学习最新研究进展(1)
一文概述联邦持续学习最新研究进展
600 0

热门文章

最新文章