解读【ICLR2020】多伦多大学:基于策略网络的探索模型规划

简介: 解读【ICLR2020】多伦多大学:基于策略网络的探索模型规划
  • 论文题目:Exploring Model-based Planning with Policy Networks


所解决的问题?


  结合模型预测控制方法的基于模型的强化学习算法已近取得不错的成绩,但是在模型预测控制那一环中如果采用的是随机动作的话,那效率就会比较低。作者就是在这个规划方面结合了一个策略。


背景


  基于模型的强化学习算法学一个model,然后拿这个model产生一些imaginary数据,或者直接优化策略。但是学一个模型就一定会产生误差,而这个误差在长期的规划过程中就会累计,导致这种方法也很难落地。

  结合random shooting(RS)算法和模型预测控制(MPC)方法能够获得较好的鲁棒性和稳定性。但是RS这种随机采样出动作的算法效率是比较低的,也较难用于高维、复杂动态的环境中去。

  作者将从另外一个视角分析,将之前的采样结合MPC的这种方法看作一个优化问题来求解。在正式介绍Model-Based Policy Planning之前,先需要了解一下Random Shooting算法和PETS算法。

image.png

所采用的方法?


  作者介绍了两种算法在动作空间中的规划,和在参数空间中的规划。定义:在时间步t tt期望的规划奖励可以表示为:

image.png

在动作空间中的策略规划

image.png

算法可描述为:

在参数空间中的策略规划

image.png

 在最终的策略选择上,作者还比较了模型预测控制(MPC)和策略直接控制两种方法。


策略提炼


  作者用模仿学习来获取规划的策略,数据来自与MPC采用的最好的动作与真实环境的交互。模仿学习有很多方法,最简单的就是behavior cloning算法:

image.png

我们也可以采用GAN网络来训练一个策略网络:

image.png

通过模型学习算法学习planning采样中比较好的算法,然后渐渐地使得整个算法变得更强。

代码实现

  1. tensorflow实现https://github.com/WilsonWangTHU/POPLIN

取得的效果?

  可以看到POPLIN算法采样会有聚焦点的改变。

所出版信息?作者信息?


相关文章
|
15天前
|
存储 安全 网络安全
云计算时代的网络安全挑战与策略
【10月更文挑战第34天】在数字化转型的浪潮中,云计算作为一项关键技术,正深刻改变着企业的运营方式。然而,随着云服务的普及,网络安全问题也日益凸显。本文将探讨云计算环境下的安全挑战,并提出相应的防护策略。
|
3天前
|
云安全 监控 安全
云计算环境下的网络安全策略与实践
在数字化时代,云计算已成为企业和个人存储、处理数据的重要方式。然而,随着云服务的普及,网络安全问题也日益凸显。本文将探讨如何在云计算环境中实施有效的网络安全措施,包括加密技术、访问控制、安全监控和应急响应计划等方面。我们将通过具体案例分析,展示如何在实际场景中应用这些策略,以保护云中的数据不受威胁。
|
11天前
|
存储 安全 网络安全
云计算与网络安全:探索云服务中的信息安全策略
【10月更文挑战第39天】随着云计算的飞速发展,越来越多的企业和个人将数据和服务迁移到云端。然而,随之而来的网络安全问题也日益突出。本文将从云计算的基本概念出发,深入探讨在云服务中如何实施有效的网络安全和信息安全措施。我们将分析云服务模型(IaaS, PaaS, SaaS)的安全特性,并讨论如何在这些平台上部署安全策略。文章还将涉及最新的网络安全技术和实践,旨在为读者提供一套全面的云计算安全解决方案。
|
11天前
|
云安全 安全 网络安全
云计算与网络安全:技术挑战与解决策略
【10月更文挑战第39天】随着云计算技术的飞速发展,网络安全问题也日益凸显。本文将探讨云计算环境下的网络安全挑战,并提出相应的解决策略。通过分析云服务模型、网络安全威胁以及信息安全技术的应用,我们将揭示如何构建一个安全的云计算环境。
|
11天前
|
存储 网络协议 安全
30 道初级网络工程师面试题,涵盖 OSI 模型、TCP/IP 协议栈、IP 地址、子网掩码、VLAN、STP、DHCP、DNS、防火墙、NAT、VPN 等基础知识和技术,帮助小白们充分准备面试,顺利踏入职场
本文精选了 30 道初级网络工程师面试题,涵盖 OSI 模型、TCP/IP 协议栈、IP 地址、子网掩码、VLAN、STP、DHCP、DNS、防火墙、NAT、VPN 等基础知识和技术,帮助小白们充分准备面试,顺利踏入职场。
36 2
|
14天前
|
云安全 安全 网络安全
云计算与网络安全:挑战与应对策略####
云计算作为信息技术的一场革命,为数据存储和计算提供了前所未有的便利和效率。然而,随着云计算的广泛应用,其带来的网络安全问题也日益凸显。本文将探讨云计算环境下的主要网络安全挑战,包括数据泄露、网络攻击、身份和访问管理等问题,并分析云服务提供商和企业用户如何通过技术手段和管理策略来应对这些挑战。此外,还将讨论云计算与信息安全领域的最新发展趋势,旨在为读者提供一个全面的理解和实用的指导。通过深入剖析云计算的工作原理和安全机制,我们可以更好地理解如何保护我们的网络和信息安全。只有云计算提供商和用户共同努力,才能建立一个安全可靠的云计算环境。 ####
|
11天前
|
运维 网络协议 算法
7 层 OSI 参考模型:详解网络通信的层次结构
7 层 OSI 参考模型:详解网络通信的层次结构
33 1
|
14天前
|
监控 安全 网络安全
网络安全的盾牌:漏洞防御与加密技术的现代策略
【10月更文挑战第36天】在数字化浪潮中,网络安全成为保护个人隐私和企业资产的关键防线。本文深入探讨网络安全漏洞的成因、影响及防御措施,并分析加密技术如何为信息安全提供坚固保障。通过案例分析和代码示例,揭示提升安全意识的重要性及其在防范网络攻击中的作用,旨在为读者提供一套全面的网络安全解决方案和预防策略。
|
18天前
|
存储 安全 云计算
云上防线:云计算时代的网络安全策略
云上防线:云计算时代的网络安全策略
35 4
|
21天前
|
存储 安全 网络安全
云计算与网络安全:保护数据的新策略
【10月更文挑战第28天】随着云计算的广泛应用,网络安全问题日益突出。本文将深入探讨云计算环境下的网络安全挑战,并提出有效的安全策略和措施。我们将分析云服务中的安全风险,探讨如何通过技术和管理措施来提升信息安全水平,包括加密技术、访问控制、安全审计等。此外,文章还将分享一些实用的代码示例,帮助读者更好地理解和应用这些安全策略。
下一篇
无影云桌面