被Nature旗下刊物收录!我用AgentScope造了个“AI社科实验室”
科学家用AI模拟学术世界!通义实验室联合人大打造虚拟学术宇宙CiteAgent,基于自研多智能体框架AgentScope,实现数万AI科学家协同仿真,复现引文网络三大经典现象。研究获顶刊《Nature》子刊录用,开创社会科学“实验室”,推动“AI for Social Science”新范式。(回复CiteAgent获取论文)
蚂蚁百宝箱首届「插件开发大赛」,赛事持续至12月7日,最高赢取3W奖金!
首届「MCP插件开发大赛」由蚂蚁百宝箱联合通义灵码发起,聚焦企业场景,鼓励开发者基于AI Agent打造高效、创新的MCP插件。赛事持续至2025年12月7日,提供最高3万元现金奖励、免费AI工具支持及全程技术指导。参赛者可借助通义灵码开发,通过蚂蚁百宝箱发布部署,并在NeMo Agent Toolkit平台验证智能体效果。无论新手或专家,皆可实战练兵,推动AI技术落地,赢取丰厚回报。
基于人类反馈的强化学习:对齐AI与人类价值观的技术革命
基于人类反馈的强化学习(RLHF)是一种通过人类偏好来训练AI的技术,使其行为更符合人类价值观。它分三阶段:先用示范数据微调模型,再训练奖励模型预测人类偏好,最后用强化学习优化模型。相比传统方法,RLHF在安全性、创造力、数据效率等方面优势显著,能有效提升AI的对齐性与实用性,是实现有益人工智能的关键路径。