近年来,人工智能(AI)领域取得了显著的进展,从基础模型(如GPT和Claude)到各种智能体系统,AI在各个任务中展现出了强大的能力。然而,设计和开发这些智能体系统通常需要大量的人力和专业知识。为了解决这个问题,来自不列颠哥伦比亚大学(UBC)的研究人员提出了一种名为"自动智能体系统设计(Automated Design of Agentic Systems,ADAS)"的新方法。
ADAS的目标是通过自动化的方式来设计和开发智能体系统,包括发明新的构建模块和/或以新的方式组合它们。研究人员提出了一种基于代码的方法,其中智能体被定义为代码,而一个"元智能体"则负责编程和改进这些智能体。这种方法的理论基础是编程语言的图灵完备性,这意味着在理论上,任何可能的智能体系统都可以通过这种方式来学习和设计。
为了验证他们的方法,研究人员进行了广泛的实验,包括在多个领域(如编码、科学和数学)中进行测试。结果显示,通过ADAS设计出来的智能体系统在性能上显著超过了现有的手工设计的智能体系统。例如,在阅读理解任务中,ADAS智能体系统的F1分数提高了13.6/100,而在数学任务中,准确率提高了14.4%。更令人印象深刻的是,当将这些智能体系统转移到其他领域和模型时,它们仍然保持了出色的性能,这表明了它们的鲁棒性和通用性。
然而,尽管ADAS取得了令人鼓舞的成果,但也有一些潜在的问题和挑战需要解决。首先,安全性是一个重要的考虑因素,因为在执行由模型生成的代码时存在潜在的风险。研究人员建议使用沙箱环境来安全地运行未受信任的模型生成的代码。其次,ADAS的可扩展性和效率也是一个问题,因为在实践中,可能需要考虑多个目标(如成本、延迟和鲁棒性),并且可能需要更复杂的搜索算法来平衡探索和利用。