近日,阿里云联合魔搭社区和Datawhale发起的第四季Create@AI创客松在上海模速空间完成Demo Day路演。当天共有25支队伍从全球150+队伍中脱颖而出线下进行路演,并由多位AI领域的专家组成专业评审团,从技术能力、产品体验、市场前景、创新思路、云上创新等多个维度进行综合评审,评选出本次Create@AI创客松的各个奖项。
01 Multi-Agent的25种解题思路
随着 Agent的兴起,大家逐渐认识到单一Agent的局限性。综合多个不同功能的LLM-Powered Agent 的优点,通过多个 AI 智能体一起工作,分配任务并讨论和辩论想法,以提出比单个智能体更好的解决方案。斯坦福大学教授吴恩达也曾公开表示非常看好多智能体的发展,认为多智能体协作可以取得比单个智能体更好的性能。他期待AI智能体工作流在未来引领人工智能的新趋势。正是因为如此,本次比赛demo day现场吸引了诸多观众,期待通过本次比赛的参赛作品一窥AI未来。
图|赛前“试用试玩环节”吸引诸多AI从业者和爱好者前来交流
透过本次比赛,我们可以看到游戏领域是MultiAgent最多落地的场景,Action、药品知识科普小分队、模法创新者从教育科普类游戏切入,瓦力向前冲均借助多智能体的方式为游戏带来更多个性化的体验;X-D Lab心动实验室、终抵繁星、鬼斧神工则带来沉浸式的角色扮演体验。
效率工具领域则是第二多落地的场景,AgentFreedom、cjy的队伍借助Multi-Agent提升视频和文本生成效率;嘉喻户晓、今日宜开摆、MVP小组、SQL BOY、赛博大叔、无可比倪队伍通过Multi-Agent重构工作流,为广告、设计、工程等场景实现降本增效。
而在广泛的生活需求上,包括生活减压、社交矛盾调解、儿童陪伴、提升学习效率等,甚至小到推荐一杯鸡尾酒,针对这些日常生活方方面面的需求,金牌调解员、老板说什么都不对、MumuLab、你有高速运转的机器进入UESTC、SUN、职场驭师、致胜AI创客、智慧协同小队这些队伍也分别从不同角度给出多智能体应用解决方案。
参赛选手们现场展示开发成果,并与观众和评委团进行交互体验。此次比赛也创新性开设观众互动环节,不仅有路演前的交流试玩,在路演中也邀请现场观众对心选作品参与点赞投票。
最终,以下队伍分获此次
Create@AI创客松奖项
02
从Agent到Multi-Agent,
创业者如何快速落地
此次Create@AI创客松比赛中,我们看到很多优秀的AI创业团队带来了多智能体应用作品,感受到Multi-Agent在不同领域中发挥的价值。从Agent到MultiAgent,从技术锤子走向应用落地,AI创业者们如何小步快跑,对自己的产品进行快速迭代?在推向市场过程中又会有哪些技术难题和发展挑战?对此,我们还邀请了AI领域的产、投、研专家,围绕《从Agent到MultiAgent:技术进展和应用落地》主题展开了一场圆桌讨论。
从投资的视角出发,Atom Capital创始合伙人杨孟彤看到,从早期的代表Copilot,逐渐过渡到如今的自主性更强的Agent,不仅能执行单一任务,更能承担起更为复杂的、独立闭环的工作流,实现某种程度的自主操作。这也意味着Agent正逐渐演变为具备完整功能的数字员工,能够在更多实际场景中落地应用,成为AI工作力量的重要组成部分。这一发展趋势被视为极具潜力和前景的赛道。
阿里巴巴集团投资部执行董事王冉也表示,随着底层模型的持续迭代更新,短期来看,Agent可能在精准度要求相对较低的游戏和C端消费领域中更容易落地,但从长期来看,Agent技术在效率提升和工具应用等B端场景中有望替代部分人工操作,并在某些方面超越。随着技术成熟,企业级和专业化应用场景将迎来更多的发展机遇和突破。
技术锤子在走向落地的过程中,AI创业者们还面临着很多难题,其中首当其冲的是模型幻觉问题。很多AI开发者会使用RAG技术进行优化。复旦大学计算机科学技术学院教授张奇肯定了RAG技术的积极作用,但也提到提升的过程仍面临重大挑战,尤其是在达到更高层次的性能时。例如,PDF解析和向量检索等任务在处理复杂格式和提高检索准确率方面存在困难。尽管大型模型提供了一定程度的改进,但在长文本处理等方面仍有待提高。将技术从demo到实际应用还需要在每个技术环节进行细致的优化,这是一个既艰难又必要的过程。
尽管挑战重重,目前市场上已经出现了相对成熟的多智能体产品,例如斯坦福小镇等,但也引起了社会对人机协作关系的广泛讨论。中国人民大学高瓴人工智能学院教授魏哲巍认为多智能体应用正深刻影响人文社会科学的研究范式。通过多智能体系统,能够模拟现实中不可行或具有争议的社会实验,例如公租房分配实验等。
总的来看,Multi-Agent在提升大型模型性能和应用效果方面有巨大潜力和长远意义。通义实验室资深算法专家李雅亮也提出,通过Multi-Agent系统积累的数据和经验,可以用于训练下一代大模型,使其具备更强的CoT(Chain of Thought,大模型思维链)能力。从长远来看,随着大模型CoT能力的提升,原本需要Multi-Agent协同完成的任务可能会由单个智能体独立完成。
图|圆桌讨论现场
对于创业者而言,从技术走向应用不是重点,市场才是真正的目的地。正如澜码科技创始人兼CEO周健在启发演讲中总结的,AI创业者从想法到PMF的过程中,首先要找到解决问题的市场和目标客户群体,并在销售过程中需要不断地迭代和改进产品,寻找合适的销售渠道。产品走向市场过程中,品牌宣传和个人影响力可以帮助提高获客效率,而数据分析和用户反馈对于优化产品和提高转化率非常重要。创业者需要找到适合自己擅长的领域和专业技能,发挥自己的竞争优势。
图|周健 澜码科技创始人兼CEO
03
“云+AI”,构建多智能体
应用开发新范式
今天,“云+AI”正成为一种创业新范式。阿里云在2023年9月正式推出创业者计划。该计划可以为创业者提供最高100万元的上云抵扣金,阿里云中小企业品牌总经理储尔勇在开场致辞中特别强调希望通过该计划帮助创业者快速启动,“为创业者创新成长提速”。据悉,当前已超过1.3万家创业公司申请加入。
图|阿里云中小企业品牌总经理储尔勇开场致辞
同时为了助力更多AI创业者快速构建自己的多智能体应用,阿里云与魔搭社区提供了云上创新资源支持。
阿里云所提供的“云+AI工具箱”,让初创团队快速从0 启动,搭建自己的产品。阿里云一站式大模型应用开发平台——百炼,通过集成了国内外主流优质大模型,提供模型选型、微调训练、安全套件、模型部署等服务和全链路的应用开发工具,为选手简化了底层算力部署、模型预训练、工具开发等复杂工作。本次比赛中参赛队伍就通过百炼快速调用了通义千问Qwen-max 、通义千问Qwen-VL-max 的能力。与此同时,在PaaS层,阿里云人工智能平台PAI作为机器学习/深度学习工程平台,提供包含数据标注、模型构建、模型训练、模型部署、推理优化在内的AI开发全链路服务,为初创团队提供低门槛、高性能的云原生AI工程化能力。
此次Create@AI创客松比赛中,选手们都基于AgentScope框架进行多智能体应用开发。AgentScope是全新开源的Multi-Agent框架,提供了分布式模式,支持将同一个应用中的多个 Agent 运行在不同的进程甚至不同的机器上。该框架可以让多个Agent通讯及协作,从而提升任务完成的准确率和稳定性。
为创新成长提速,
下一季Create@AI创客松再会!
/ END /