检索增强预训练框架MaskSearch:让AI更聪明地“找答案”
通义实验室发布的MaskSearch预训练框架,让AI具备“主动搜索+多步推理”能力,更精准回答复杂问题。其核心是检索增强掩码预测(RAMP)任务,通过监督微调与强化学习结合,使小模型性能媲美大模型。实验表明,在多个问答数据集中,经过RAMP预训练的模型表现优异,尤其在多跳推理任务中优势显著。此外,课程学习策略帮助模型从简单到复杂逐步提升推理能力。相关论文与代码已开源。
什么是粒子群算法
粒子群算法(PSO)是一种元启发式优化算法,通过模拟鸟群或鱼群行为进行优化搜索。1995年由Kennedy和Eberhart提出,基于鸟类群体行为建模。算法通过粒子在搜索空间中移动,不断更新位置和速度,逐步逼近最优解。其流程包括初始化、评估、更新最佳位置及速度,直至满足终止条件。该算法具有简单性、全局搜索能力和良好收敛性,并广泛应用于函数优化、神经网络训练等多个领域。为克服局部最优和收敛速度慢的问题,已有多种改进策略。