决策智能

首页 标签 决策智能
# 决策智能 #
关注
2364内容
|
6月前
| |
来自: 云效DevOps
安利一个求职刷题小妙招、变身 offer 收割机 | 《趣玩》第 2 期
通义灵码目前支持的模型已经全面升级,包括 qwen 2.5、qwen 2.5-max,以及通过强化学习优化的增强版推理模型 qwq-plus。
云栖战略参考主编解读(总第18期)
人工智能的快速发展正在重塑全球商业格局,智实融合的未来已经近在咫尺。阿里云联合钛媒体发布《云栖战略参考(总第18期)》,特邀本期主编参与对话解读。
上周多模态论文推荐:MAPS、MapGlue、OmniGeo、OThink-MR1
由西安交通大学、新加坡国立大学和南洋理工大学联合提出,该工作推出了MAPS框架,利用基于Big Seven人格理论的七个智能体和苏格拉底式引导,解决多模态科学问题(MSPs)。通过四阶段求解策略和批判性反思智能体,MAPS在EMMA、Olympiad和MathVista数据集上超越当前最佳模型15.84%,展现了卓越的多模态推理与泛化能力。
Multi-Agent Orchestrator:亚马逊开源AI智能体自动协作黑科技!重构人机交互逻辑,1秒精准分配任务
Multi-Agent Orchestrator 是亚马逊开源的多智能体框架,能够动态分配代理、维护上下文、支持多种代理类型,适用于客户服务、智能交通、物流配送等复杂场景。
GPT-4o-Transcribe:OpenAI 推出高性能语音转文本模型!错误率暴降90%+方言通杀,Whisper当场退役
GPT-4o-Transcribe 是 OpenAI 推出的高性能语音转文本模型,支持多语言和方言,适用于复杂场景如呼叫中心和会议记录,定价为每分钟 0.006 美元。
主流多智能体框架设计原理
本文描述了关于智能体(Agents)和多智能体系统(Multi-Agent Systems, MAS)的详尽介绍,涵盖了从定义、分类到具体实现框架的多个方面。
|
6月前
|
18k个视频、专为自动驾驶世界模型设计,DrivingDojo数据集来了
DrivingDojo是首个专为训练复杂驾驶动态交互式世界模型设计的大规模驾驶视频数据集,包含约18k个视频,覆盖多城市、多天气条件下的驾驶场景。它注重丰富的纵向与横向驾驶操作、多智能体交互及开放世界罕见事件(如动物横穿马路)。此外,研究团队还提出动作指令跟随(AIF)基准,用于评估世界模型的预测能力。尽管数据集在多样性上取得突破,但仍存在局限性,例如主要依赖前视摄像头数据。DrivingDojo为自动驾驶世界模型的研究提供了重要平台,但也提醒我们关注技术集成、计算成本及社会伦理等挑战。
Manus再遭复刻!开源多智能体协作工具,实时查看每个AI员工的"脑回路"
LangManus 是一个基于分层多智能体系统的 AI 自动化框架,支持多种语言模型和工具集成,能够高效完成复杂任务,适用于人力资源、房产决策、旅行规划等多个场景。
|
6月前
| |
GoT:基于思维链的语义-空间推理框架为视觉生成注入思维能力
本文探讨GoT框架如何通过语义-空间思维链方法提升图像生成的精确性与一致性。GoT(Generative Thoughts of Thinking)是一种创新架构,将显式推理机制引入图像生成与编辑领域。它通过语义推理分解文本提示,空间推理分配精确坐标,实现类人的场景构思过程。结合大型语言模型和扩散模型,GoT在复杂场景生成中表现出色,克服传统模型局限。其专用数据集包含900万样本,支持深度推理训练。技术架构融合语义-空间指导模块,确保生成图像高质量。GoT为图像生成与编辑带来技术革新,广泛应用于内容创作与教育工具开发等领域。
免费试用