1、Introduction
蚁群算法(Ant Colony Optimization)是一种求解组合优化问题的元启发式算法。蚁群算法的思想起源于蚂蚁依靠共享信息素(pheromone)信息来寻找最短路径的现象,在ACO中,蚁群中的蚂蚁依靠信息素为指导来构造和改进解方案。
当前蚁群算法在静态优化问题和动态优化问题之中都有广泛的应用。蚁群算法作为构造算法(construction heuristic)的一种拓展算法,在构造的过程中将信息素信息考虑进去来构造解方案。
2、ACO元启发式算法
ACO算法在迭代构造解的过程之中应用到的信息包括以下两个方面:1) 算例的启发式信息(如路径问题中的距离);2) 反应蚂蚁路径搜索轨迹的信息素。
2.1 ACO中蚂蚁的行为细节
给定一个图网络 G=(C,L),其中 C表示图的组成成分(节点),L表示图的边。在执行ACO算法构造解的过程中,可以使用**“hard way”来构造的解,所有的解均不可以违反约束,也可以使用“soft way”**来构造解,某些解可以违反某些约束,但是这种解需要根据违反约束的程度来添加惩罚项(penalization)。
定义信息素 τ \tau τ若信息素和网络中的节点相关联, τij若信息素和网络中的边相关联;启发式信息 ηi若和节点相关联, ηij若和边相关联)。在ACO中,系统之中的每一个蚂蚁 k具有以下特点:
1)它通过探索网络 G=(C,L)来构造费用最小的解方案;
2)每一个蚂蚁k会有一个记录自己访问过路基的记忆 Mk,这个记忆信息可以用来继续构造可行解,来评判已经得到的解的优劣和更新信息素。
3)当蚂蚁 k k k在状态 xr=<xr−1,i>将要向节点 j ∈ N i k移动时 Nik表示蚂蚁 k在节点 i时的可行邻域),产生的新的状态 <xr,j>可以可行或者不可行。
4)每一个蚂蚁通过概率选择函数来选择移动方向,其中概率选择函数中包含的信息有:信息素,启发式信息,蚂蚁当前记忆信息和问题约束信息。
5)当终止条件满足时,终止蚂蚁的解方案构建。若不允许产生不可行解方案,则当构造不可行时,停止构造。
6)“步进信息素更新”(step-by-step pheromone update),表示每一次添加新的节点到某个蚂蚁的解之中,都需要对这个蚂蚁的信息素进行更新。
7)“在线延迟信息素更新”(online delayed pheromone update),表示在一个解方案构造完毕之后,在回溯整个解方案进行信息素的更新。
2.2 ACO构造解的过程
一个蚁群之中的蚂蚁并发地向网络 G G G中的邻域状态进行拓展来分别构造各自的路径,他们移动的方向收到概率选择函数的指导,通过不断的移动,每一个蚂蚁都向着构造组合优化问题的解方向靠近。一旦某个蚂蚁构造成功一个解方案,这个蚂蚁评估构造的解方案的优劣并进行信息素的更新。更新完毕的信息素又会通过概率选择函数指导后续蚂蚁的解方案构造过程。
2.3 信息素的消失和维持
信息素的消失(evaporation) 是将之前蚂蚁更新的信息素随着迭代次数的增加逐渐减小的过程。信息素的消失可以有效避免解太快收敛到一个局部最优解,同时可以帮助探索新的求解空间。
信息素维持(daemon) 可以帮助提高算法局部寻优的效果,在实际操作中,可以通过选择当前解方案最优的解,将当前最优解的信息素的更新占比加大,来提高最优解对于后续寻优的影响,这个过程也称为“离线信息素更新机制”off-line pheromone update。
3、ACO应用于VRPTW问题
初始化将每个蚂蚁 k放在互不相同的一个客户点上,作为蚂蚁 k第一个访问的客户点,并且每个蚂蚁需要记录自己访问的路径序列,访问时间和载重量信息(memory),之后蚂蚁 k向分别向其他城市进行拓展,在第 t次迭代时,位于客户点i 的蚂蚁 k k k向客户点 j拓展的概率选择函数如下所示:
其中, ηij=dij1是实现可以获得的启发式信息, α \alpha α和 β \beta β是决定信息素和启发式信息影响程度的参数,Nik是蚂蚁 k的可行邻域,表示从客户点i可以拓展的客户点集合。若将 α \alpha α取值为0,则将不考了信息素对于后续解方案构造的影响,则距离客户点 i i i越近的客户点越容易被选中;若 β \beta β的取值为0,则将只考虑信息素的影响来构建解方案,将出现停滞现象(stagnation situation),即后续蚁群构造的解方案都将相同,不利于向最优解方向进行继续寻优。
当一个蚂蚁构造完一个解方案之后,通过更新完的解方案来更新信息素,更新方式如下所示:
其中, ρ \rho ρ是信息素消失的速率系数,其值越大,信息素消失的越快; m表示蚁群中蚂蚁的个数。 Δτijk(t)表示蚂蚁 k在弧 (i,j)上留下的信息素的数值,其计算方式如下所示:
其中,1/Lk(t)表示第k个蚂蚁访问路径的长度。通过上式可知,蚂蚁构建路径的长度越短,则这个蚂蚁路径访问过的弧的信息素的量越大。通常情况下,被许多蚂蚁使用的弧和在较短路径中使用的弧可以获得更多的信息素,从而在未来路径的构建之中更易被选到来构建路径。
4、ACO算法的改进方法
4.1 精英策略-elitist strategy
精英策略的思想在于基于当前最优解额外的信息素更新权重,在每一次信息素更新时,对于当前全局最优解中包含的弧给与额外的信息素权重,通过系数e来实现。应用了精英策略的上式(3)变为如下所示的形式:
其中 Lgb表示当前最优解的路径长度(成本)。
4.2 等级蚂蚁体系-rank-based version of Ant System( ASrank)
ASrank是精英策略的一种拓展策略,在ACO的所有解构造完成之后,将所有的解按照成本大小从小到大进行排序,值选择前 w−1个解方案和当前最优解方案进行信息素的更新。第 r个蚂蚁的解方案对于信息素更新的权重取值为:max{0, w−r},当前最优解对于信息素更新的权重取值为: w。在 ASrank下的上式(2)的表示形式如下所示:
其中
4.3 信息素重置
当连续一定迭代次数没有对当前解进行优化,或者总迭代次数达到一定的次数时,可以将信息素重置为初始化水平,从而达到改变求解空间的效果。
4.4 ACO和LS结合
在进行ACO的过程之中可以嵌入LS算法来局部优化每一个蚂蚁找到的解方案,同时优化之后的解方案被用来进行信息素的更新操作。
4.5 候选列表-candidate lists
当求解问题的邻域空间较大时,蚁群之中的蚂蚁很可能不在同一个求解空间之中,使得ACO的求解效率大大降低。为了弥补这一缺陷,可以使用候选列表的方式。对于VRPTW问题,在实际操作中,对于每一个客户点i,其候选列表包含 cl个与之距离最近的客户点,在构建解方案的过程中,首先选择候选列表中的客户点进行解方案的构建,之后再从其余客户点中选择客户点进行解方案的构建。
5、ACO求解VRPTW代码已上传值GitHub
https://github.com/Dragon-wang-fei-long/Huristic-code/tree/Dragon-wang-fei-long-ACO