🔥 内容介绍
摘要:群体智能作为人工智能领域的重要分支,通过模拟生物群体的协作行为实现复杂问题的求解。本文围绕群体智能算法在自动导引车(AGV)路径规划与自主避障中的应用展开研究,深入探讨了改进秃鹰搜索算法(MBESP)的核心机制与工程实践。文献综述部分系统梳理了群体智能算法的发展脉络、多智能体系统在路径规划中的应用现状及关键技术挑战;工程应用部分以 MBESP 算法为核心,结合栅格地图建模与多目标物料配送场景,验证了算法在动态环境中的有效性;未来发展方向部分从算法优化、跨领域融合及社会应用拓展三个维度,提出了群体智能算法在AGV领域的潜在研究方向。研究表明,群体智能算法通过模拟生物群体的自组织特性,为AGV在复杂环境下的路径规划提供了高效解决方案,其与强化学习、分布式优化等技术的融合将成为未来重要发展趋势。
关键词:群体智能算法;AGV 路径规划;自主避障;多智能体系统;复杂网络
1 引言
群体智能(Swarm Intelligence)的概念最早由Reynolds于1987年在模拟鸟群行为的研究中提出,其核心思想是通过个体间的简单交互实现群体层面的智能涌现。这类算法不依赖集中式控制,具有自组织、分布式和鲁棒性强等特点,特别适合解决动态环境下的复杂优化问题。自动导引车(Automated Guided Vehicle,AGV)因效率高、路线灵活可规划等优点被广泛应用于智能制造车间和物流运输等领域,具备有较优的路径规划能力后,在一定程度可实现作业过程的全自动化。但在作业过程中周围环境经常出现障碍物,会妨碍AGV的正常工作。在实现有效自主避障的同时,能够规划出一条起始点到各个目标点的零碰撞的最优路径实现目标配送,是学者们研究的热点。文献[1]针对车辆的局部路径规划提出了改进的RRT算法[1],概率完备且搜索速度快,但由于其扩张的特性,通常规划出非最优路径;文献[2]通过改进PSO-PIO算法成功实现了AGV栅格地图避障,但受限于两种群体智能方法的结合,本身依赖较高的迭代次数,实时规划性能不理想[2];文献[3]提出了一种拓扑栅格混合建模的方法,利用遗传算法规划路径,但参数繁多,收敛速度慢[3];文献[4]利用D*Lite得到了一条较为平滑的最短路径,但在复杂环境下,全局搜索能力不足[4]。综上,以上算法针对二维环境下AGV路径规划及自主避障的优化效果及迭代收敛速度均有一定的改进空间。秃鹰搜索算法[5](Bald Eagle Search,BES)是2020年Alsattar提出的一种新型元启发式群体智能算法,模拟了秃鹰捕猎的过程,具有收敛速度较快,适应性强,模型易修改等特点,可以优化AGV路径规划及自主避障。但BES本身搜索能力不足,在选取局部最优等时缺陷较大,需进一步改进。因此,本文提出了一种基于猎物导引的多策略融合秃鹰搜索算法(Multi-Bald Eagle Search base on Prey-guidance,MBESP),并用于AGV路径规划及自主避障,能快速寻优,可以获取到较为平滑的最优路径。
2 相关文献综述
2.1 群体智能算法的发展与理论基础
从算法发展脉络来看,群体智能算法主要分为基于群体觅食行为和基于群体迁徙行为两大类别。前者以蚁群算法(Ant Colony Optimization, ACO)、粒子群优化算法(Particle Swarm Optimization, PSO)为代表,后者则包括遗传算法(Genetic Algorithm, GA)、秃鹰搜索算法(Bald Eagle Search, BES)等。
蚁群算法由Dorigo于 1992 年提出,通过模拟蚂蚁觅食过程中分泌信息素的行为实现路径优化。该算法在离散优化问题中表现出优异性能,如旅行商问题(TSP)的求解,但在高维复杂环境下存在收敛速度慢的缺陷。粒子群优化算法由Kennedy和 Eberhart于1995年提出,通过模拟鸟群的社会行为,将每个解视为空间中的粒子,通过个体最优和群体最优信息更新粒子位置。PSO算法结构简单、参数少,但其容易陷入局部最优的问题限制了在复杂路径规划中的应用。
秃鹰搜索算法(BES)作为一种新兴群体智能算法,由Alsattar于2020年提出,通过模拟秃鹰的捕猎行为(区域选择、螺旋搜索和俯冲捕获三个阶段)实现优化求解。与传统算法相比,BES 具有收敛速度快、参数适应性强的特点,但在二维路径规划中存在搜索能力不足、易陷入局部最优的缺陷。本文提出的 MBESP(Multi-Bald Eagle Search based on Prey-guidance)算法通过引入猎物导引机制、动态自适应变异算子及柯西-莱维融合策略,有效提升了 BES 算法的全局搜索能力和收敛精度。
2.2 多智能体系统在路径规划中的应用进展
多智能体系统(Multi-Agent System, MAS)是指由多个具有自主决策能力的智能体组成的分布式系统,各智能体通过信息交互和协作完成复杂任务。将多智能体系统与群体智能算法结合,为AGV路径规划提供了新的技术路径。近年来,该领域的研究主要集中在多智能体一致性分析、分布式优化和强化学习融合三个方向。
在多智能体一致性分析方面,Ren等学者提出的一致性理论为多智能体系统的协同控制提供了理论基础。该理论证明,通过设计合适的交互拓扑结构和控制协议,多个智能体可以在状态信息不完全共享的情况下达成一致。在AGV路径规划中,一致性分析主要用于解决多车协同避障和任务分配问题。例如,Xiao等学者利用一致性理论设计了分布式模型预测控制算法,实现了多AGV在动态环境中的协同路径规划。然而,传统一致性算法在处理高维非线性系统时计算复杂度较高,限制了其在实时性要求严格的场景中的应用。
分布式优化方法通过将复杂优化问题分解为多个子问题,由各智能体独立求解并通过信息交互实现全局最优。这类方法与群体智能算法具有天然的契合性,如分布式蚁群算法(Distributed Ant Colony Optimization, DACO)通过各智能体独立更新信息素矩阵,实现了多 AGV 路径规划的分布式求解。Li等学者提出的分布式粒子群优化算法(Distributed Particle Swarm Optimization, DPSO)在物流配送场景中展现出优异的性能,但其在处理大规模多目标问题时仍存在收敛速度慢的问题。
多智能体强化学习(Multi-Agent Reinforcement Learning, MARL)通过让智能体在环境中交互学习,自动获取最优策略,为动态不确定环境下的路径规划提供了数据驱动的解决方案。Zhang等学者提出的深度多智能体强化学习框架(Deep Multi-Agent RL)在复杂仓库环境中实现了多 AGV 的实时避障与路径优化。然而,MARL算法存在样本效率低、训练时间长和收敛稳定性差等挑战,特别是在非平稳环境中,智能体间的策略交互可能导致联合策略空间的组合爆炸问题。
2.3 AGV 路径规划的关键技术挑战
AGV 路径规划作为智能物流和智能制造的核心技术,其研究面临着动态环境适应性、多目标优化和系统鲁棒性等关键挑战。从技术实现角度看,这些挑战主要体现在以下三个方面:
(1)动态环境下的实时避障:传统路径规划算法(如 A*、Dijkstra)基于静态环境假设,难以处理突发障碍物或动态变化的场景。虽然动态窗口法(Dynamic Window Approach, DWA)等局部规划方法通过速度空间采样实现了实时避障,但这类方法缺乏全局视野,容易陷入局部最优。群体智能算法通过引入随机性和全局搜索机制,在动态环境中表现出更强的适应性。例如,Wang等学者将改进的粒子群算法与滚动时域优化结合,实现了 AGV 在动态工厂环境中的实时路径规划。
(2)多目标优化与约束处理:实际应用中,AGV 路径规划通常需要同时优化路径长度、行驶时间、能量消耗等多个目标,同时满足运动学约束(如最小转弯半径)和安全约束(如避障距离)。传统单目标优化方法通过加权求和将多目标问题转化为单目标问题,这种方法难以处理目标间的冲突和权重设置的主观性。多目标群体智能算法(如多目标蚁群算法、多目标粒子群算法)通过维护帕累托最优解集,为多目标路径规划提供了有效解决方案。例如,Deb 等学者提出的 NSGA-II 算法在多 AGV 任务分配与路径规划中实现了多个目标的协同优化,但该算法在高维目标空间中存在收敛速度慢、解集分布性差的问题。
(3)多智能体协同与分布式控制:随着智能工厂和智慧物流的发展,多 AGV 协同作业成为主流趋势。多智能体协同路径规划需要解决任务分配、冲突消解和轨迹协调等问题。传统集中式控制方法虽然能获得全局最优解,但存在单点故障风险和计算复杂度高的缺陷。分布式群体智能算法通过各 AGV 独立决策并局部交互,实现了协同路径规划的自组织求解。例如,Liu 等学者提出的分布式秃鹰搜索算法(Distributed BES)在多 AGV 仓储物流场景中实现了高效的任务分配与路径规划,但其在动态拓扑变化和通信延迟情况下的鲁棒性仍需进一步提升。
2.4 现有研究的不足与本文的切入点
综合现有研究,群体智能算法在 AGV 路径规划中的应用仍存在以下不足:
(1)全局搜索能力与收敛速度的平衡:大多数群体智能算法难以同时兼顾全局探索和局部开发能力,如 PSO 算法前期收敛快但易陷入局部最优,ACO 算法全局搜索能力强但收敛速度慢。BES 算法虽然在收敛速度上表现优异,但其在二维路径规划中存在搜索空间利用不充分的问题。
(2)动态环境下的适应性不足:现有算法在处理环境动态变化(如突发障碍物、目标点变更)时,往往需要重新初始化或大幅调整参数,难以满足实时性要求。虽然部分研究将强化学习与群体智能结合,但在非平稳环境中的策略更新效率仍有待提高。
(3)多智能体协同中的通信与计算开销:分布式群体智能算法在多 AGV 协同场景中,随着智能体数量增加,信息交互量呈指数级增长,导致通信拥堵和计算延迟。如何在有限通信带宽下实现高效的协同决策,是亟待解决的问题。
针对上述问题,本文提出的 MBESP 算法通过以下创新点实现突破。
表2-1 具体算法流程
步骤1:种群初始化 首先构建栅格地图(多目标城市点)模型,确定种群数目n和迭代次数MaxIt,初始化秃鹰种群,选出当前迭代中最优个体与最差个体,并计算种群的适应度。 步骤2:迭代更新 融合莱维飞行策略和柯西变异进行搜索空间的选择,根据修订后的更新公式(27)和(28)基于既定空间的猎物导引机制进行搜索。 步骤3:边界限定 根据已规定的二维空间的大小限定轨迹点的范围,若存在边界溢出,则用该轨迹点溢出维度的边界值代替。 步骤4:利用带反馈机制的动态选择自适应t分布变异算子增强全局搜索。 步骤5:八叉树搜索策略获取平滑路径。 步骤6:根据循环结束条件,判断是否达到最大迭代次数。若未达到,则跳回步骤2;达到则终止循环。 |
⛳️ 运行结果
📣 部分代码
% G=[ 1 1 1 1 1 1 1 1 1 1
% 1 1 1 1 1 1 1 1 1 1
% 0 0 0 0 0 0 0 0 0 0
% 0 0 0 0 0 0 0 0 0 0
% 0 0 0 0 0 0 0 0 0 0
% 0 0 0 0 0 0 0 0 0 0
% 0 0 0 0 0 0 0 0 0 0
% 0 0 0 0 0 0 0 0 0 0
% 1 1 1 1 1 1 1 1 1 1
% 1 1 1 1 1 1 1 1 1 1];
function drawShanGe(G,flag)
%%%% 输入参数 G 栅格矩阵 0表示自由栅格,1 表示障碍栅格
%%%% flag 标志,1表示栅格图不带序号,0表示栅格图不带序号
[mGrid,nGrid]=size(G);
for xk=1:nGrid
for yk=1:mGrid
flag=0;
% 栅格四个顶点的坐标
ax=xk-1; ay=yk-1;
bx=xk; by=yk-1;
cx=xk; cy=yk;
dx=xk-1; dy=yk;
% 栅格序号
No=(xk-1)+(yk-1)*nGrid;
% 绘制栅格
if G(yk,xk)==0 % 自由栅格,白色
fill([ax bx cx dx],[ay by cy dy],[1 1 1]);
hold on
if flag==1
text(ax+0.3,ay+0.5,num2str(No))
end
else % 障碍栅格,灰色
fill([ax bx cx dx],[ay by cy dy],[0.2 0.2 0.2]);
hold on
if flag==1
text(ax+0.3,ay+0.5,num2str(No),'Color','w')
end
end
axis equal
axis([0 nGrid 0 mGrid])
axis off
end
end
🔗 参考文献
[1] 王硕,段蓉凯,廖与禾.机器人路径规划中快速扩展随机树算法的改进研究[J].西安交通大学学报,2022,56(07):1-8.
[2] 秦昌礼,张华强,刘林,陈雨,苏庆华.一种基于改进PSO-PIO算法的AGV路径规划方法[J].哈尔滨理工大学学报, 2022(03):82-89.
[3] 徐晗,金隼,罗磊,刘顺.基于拓扑栅格建模的AGV路径规划算法优化[J].计算机工程与设计,2022,43(01):101-109.
[4] 黄鲁,周非同.基于路径优化D~*Lite算法的移动机器人路径规划[J].控制与决策, 2020, 35(04): 877-884.
[5] H. A. Alsattar,A. A. Zaidan,B. B. Zaidan. Novel meta-heuristic bald eagle search optimisation algorithm[J]. Artificial Intelligence Review: An International Science and Engineering Journal,2020,53(8).