AI设计自己，代码造物主已来！UBC华人一作首提ADAS，数学能力暴涨25.9%-阿里云开发者社区

AI设计自己，代码造物主已来！UBC华人一作首提ADAS，数学能力暴涨25.9%

2024-09-15 100 发布于北京

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 【9月更文挑战第15天】近年来，人工智能领域取得了显著进展，但智能体系统的设计仍需大量人力与专业知识。为解决这一问题，UBC研究人员提出了“自动智能体系统设计（ADAS）”新方法，通过基于代码的元智能体实现智能体系统的自动化设计与优化。实验结果表明，ADAS设计的智能体在多个领域中表现优异，尤其在阅读理解和数学任务上取得了显著提升。尽管如此，ADAS仍面临安全性、可扩展性和效率等挑战，需进一步研究解决。论文详情见链接：https://arxiv.org/pdf/2408.08435。

近年来，人工智能（AI）领域取得了显著的进展，从基础模型（如GPT和Claude）到各种智能体系统，AI在各个任务中展现出了强大的能力。然而，设计和开发这些智能体系统通常需要大量的人力和专业知识。为了解决这个问题，来自不列颠哥伦比亚大学（UBC）的研究人员提出了一种名为"自动智能体系统设计（Automated Design of Agentic Systems，ADAS）"的新方法。

ADAS的目标是通过自动化的方式来设计和开发智能体系统，包括发明新的构建模块和/或以新的方式组合它们。研究人员提出了一种基于代码的方法，其中智能体被定义为代码，而一个"元智能体"则负责编程和改进这些智能体。这种方法的理论基础是编程语言的图灵完备性，这意味着在理论上，任何可能的智能体系统都可以通过这种方式来学习和设计。

为了验证他们的方法，研究人员进行了广泛的实验，包括在多个领域（如编码、科学和数学）中进行测试。结果显示，通过ADAS设计出来的智能体系统在性能上显著超过了现有的手工设计的智能体系统。例如，在阅读理解任务中，ADAS智能体系统的F1分数提高了13.6/100，而在数学任务中，准确率提高了14.4%。更令人印象深刻的是，当将这些智能体系统转移到其他领域和模型时，它们仍然保持了出色的性能，这表明了它们的鲁棒性和通用性。

然而，尽管ADAS取得了令人鼓舞的成果，但也有一些潜在的问题和挑战需要解决。首先，安全性是一个重要的考虑因素，因为在执行由模型生成的代码时存在潜在的风险。研究人员建议使用沙箱环境来安全地运行未受信任的模型生成的代码。其次，ADAS的可扩展性和效率也是一个问题，因为在实践中，可能需要考虑多个目标（如成本、延迟和鲁棒性），并且可能需要更复杂的搜索算法来平衡探索和利用。

论文地址：https://arxiv.org/pdf/2408.08435