决策智能

首页 标签 决策智能
# 决策智能 #
关注
2164内容
Satori:快速体验MIT与哈佛推出7B参数的推理专家模型,具备自回归搜索和自我纠错能力
Satori 是由 MIT 和哈佛大学等机构联合推出的 7B 参数大型语言模型,专注于提升推理能力,具备强大的自回归搜索和自我纠错功能。
Agno:18.7K Star!快速构建多模态智能体的轻量级框架,运行速度比LangGraph快5000倍!
Agno 是一个用于构建多模态智能体的轻量级框架,支持文本、图像、音频和视频等多种数据模态,能够快速创建智能体并实现高效协作。
|
3天前
|
RT-DETR改进策略【损失函数篇】| Slide Loss,解决简单样本和困难样本之间的不平衡问题
RT-DETR改进策略【损失函数篇】| Slide Loss,解决简单样本和困难样本之间的不平衡问题
|
5天前
| |
DeepSeek × 时间序列 :DeepSeek-TS,基于状态空间增强MLA与GRPO的时序预测新框架
DeepSeek-TS 是一种创新的多产品时间序列预测框架,结合了 DeepSeek 中高效的多头潜在注意力(MLA)和群组相对策略优化(GRPO)技术。该框架通过扩展 MLA 提出 MLA-Mamba,允许潜在特征通过非线性激活的状态空间模型动态演变,提供自适应记忆以适应趋势变化。同时,通过 GRPO 引入智能决策过程,持续改进预测,有效响应销售模式的突变。实验结果显示,DeepSeek-TS 在建模复杂的产品间关系和适应非线性动态方面表现出色,显著优于经典的 ARMA 模型和标准的基于 GRU 的网络。
|
5天前
|
YOLOv11改进策略【损失函数篇】| Slide Loss,解决简单样本和困难样本之间的不平衡问题
YOLOv11改进策略【损失函数篇】| Slide Loss,解决简单样本和困难样本之间的不平衡问题
|
6天前
| |
SRMT:一种融合共享记忆与稀疏注意力的多智能体强化学习框架
自反射记忆Transformer (SRMT) 是一种面向多智能体系统的记忆增强型Transformer模型,通过共享循环记忆结构和自注意力机制,优化多智能体间的协同效率与决策能力。SRMT在复杂动态环境中展现出显著优势,特别是在路径规划等任务中。实验结果表明,SRMT在记忆维持、协同成功率及策略收敛速度等方面全面超越传统模型,具备广泛的应用前景。
|
14天前
|
《深度剖析Q-learning中的Q值:解锁智能决策的密码》
Q-learning是强化学习中的重要算法,其核心是Q值,即智能体在特定状态下采取某一动作后预计能获得的长期累积奖励。Q值如同“智慧密码”,指导智能体做出最优决策。通过贝尔曼方程更新Q值,智能体能在探索与利用之间找到平衡,逐渐学习到最优策略。在简单场景中,Q表可有效存储和更新Q值;而在复杂场景如自动驾驶中,则需借助深度神经网络近似Q值函数,推动强化学习在实际应用中的突破。
FilmAgent:多智能体共同协作制作电影,哈工大联合清华推出 AI 驱动的自动化电影制作工具
FilmAgent 是由哈工大与清华联合推出的AI电影自动化制作工具,通过多智能体协作实现从剧本生成到虚拟拍摄的全流程自动化。
Baichuan-M1-14B:AI 助力医疗推理,为患者提供专业的建议!百川智能开源业内首个医疗增强大模型,普及医学的新渠道!
Baichuan-M1-14B 是百川智能推出的首个开源医疗增强大模型,专为医疗场景优化,支持多语言、快速推理,具备强大的医疗推理能力和通用能力。
免费试用