暂时未有相关云产品技术能力~
暂无个人介绍
Mac M1 报错 ld: library not found for -lSystem
斯坦福2023【FrugalGPT】减少大模型的商业化应用成本
【COT】Chain-of-Thought Prompting Elicits Reasoning in Large Language Models
【CAMEL】Communicative Agents for “Mind”Exploration of Large Scale Language Model Society
偏好强化学习概述
【AlphaHoldem】端到端强化学习玩德州扑克
分布式框架ray的基本使用记录
【HuggingGPT】Solving AI Tasks with ChatGPT and its Friends in Hugging Face
解决ValueError: Unsupported ONNX opset version: 16问题
【DouZero】 强化学习+self play达到人类玩家斗地主水平。
【5分钟Paper】Pointer Network指针网络
基于Flask创建Python服务端,并调用JavaScript客户端
基于Flask创建Python服务端,并调用Java客户端
基于Flask创建Python服务端,并调用Python客户端、C#客户端
【五分钟Paper】基于参数化动作空间的强化学习
基于模型的多智能体强化学习中的模型学习理解
OpenAI对强化学习环境的汇总
Mac M1安装ffmpeg报错DependencyNotInstalled: Found neither the ffmpeg nor avconv executables.
系统类配置(六) ubuntu16.04命令行安装Nvidia显卡驱动(操作指令详细注释版)
多智能体强化学习(二) MAPPO算法详解
Mac下安装atari_py报错Exception: ROM is missing for pong
多智能体强化学习(一) IQL、VDN、QMIX、QTRAN算法详解
强化学习实战(九) Linux下配置星际争霸Ⅱ环境
【RLchina第六讲】Imitation Learning
【RLchina第五讲】Control as Inference(上)
【RLchina第四讲】Model-Based Reinforcement Learning(下)
【RLchina第四讲】Model-Based Reinforcement Learning(上)
【ICLR2020】Dream to Control:Learning Behaviors by Latent Imagination
解读【ICLR2020】多伦多大学:基于策略网络的探索模型规划
【ICLR2020】基于模型的强化学习算法玩Atari【附代码】
约束最优化方法 (二) Zoutendijk容许方向法
约束最优化方法 (三) 外部罚函数法
约束最优化方法 (四) 乘子法
PETS:伯克利大神Sergey Levine指导的概率集成轨迹采样算法
解读:AlphaGo之父倾力打造:The Predictron端到端训练与规划
无约束最优化(五) 最小二乘法问题的解法
无约束最优化(四) 步长加速法
线性规划 (二) 单纯形法
线性规划 (一) 线性规划的基本形式及各种概念
矩阵分析 (八) 矩阵的直积
矩阵分析 (七) 矩阵特征值的估计
矩阵分析 (六) 矩阵的函数
矩阵分析 (五) 矩阵的分解
矩阵分析 (四)向量和矩阵的范数
矩阵分析 (三) 矩阵的标准形
矩阵分析 (二) 内积空间
矩阵分析 (一) 线性空间和线性变换
【Nature论文浅析】基于模型的AlphaGo Zero
操作系统原理(一)操作系统概述和操作系统用户界面(下)
操作系统原理(一)操作系统概述和操作系统用户界面