先说结论
深度学习(DL)
有强大的感知与表达能力 面向高维数据 通过多层的网络结构和非线性变换,组合底层特征 形成抽象的 易于区分的高层表示 以发现数据的分布式特征表示
强化学习(RL)
具有决策能力 通过智能体的试错机制与环境进行不断交互 从而最大化智能体从环境中获得的累计奖赏值
深度强化学习(DRL)
将具有感知能力的深度学习和具有决策能力的强化学习相结合 形成直接从输入原始数据到输出动作控制的完整只能系统
AlphaGo就是深度强化学习成功的最好表现
先说结论
有强大的感知与表达能力 面向高维数据 通过多层的网络结构和非线性变换,组合底层特征 形成抽象的 易于区分的高层表示 以发现数据的分布式特征表示
具有决策能力 通过智能体的试错机制与环境进行不断交互 从而最大化智能体从环境中获得的累计奖赏值
将具有感知能力的深度学习和具有决策能力的强化学习相结合 形成直接从输入原始数据到输出动作控制的完整只能系统
AlphaGo就是深度强化学习成功的最好表现
你好,我是AI助理
可以解答问题、推荐解决方案等