解读【ICLR2020】多伦多大学:基于策略网络的探索模型规划

简介: 解读【ICLR2020】多伦多大学:基于策略网络的探索模型规划
  • 论文题目:Exploring Model-based Planning with Policy Networks


所解决的问题?


  结合模型预测控制方法的基于模型的强化学习算法已近取得不错的成绩,但是在模型预测控制那一环中如果采用的是随机动作的话,那效率就会比较低。作者就是在这个规划方面结合了一个策略。


背景


  基于模型的强化学习算法学一个model,然后拿这个model产生一些imaginary数据,或者直接优化策略。但是学一个模型就一定会产生误差,而这个误差在长期的规划过程中就会累计,导致这种方法也很难落地。

  结合random shooting(RS)算法和模型预测控制(MPC)方法能够获得较好的鲁棒性和稳定性。但是RS这种随机采样出动作的算法效率是比较低的,也较难用于高维、复杂动态的环境中去。

  作者将从另外一个视角分析,将之前的采样结合MPC的这种方法看作一个优化问题来求解。在正式介绍Model-Based Policy Planning之前,先需要了解一下Random Shooting算法和PETS算法。

image.png

所采用的方法?


  作者介绍了两种算法在动作空间中的规划,和在参数空间中的规划。定义:在时间步t tt期望的规划奖励可以表示为:

image.png

在动作空间中的策略规划

image.png

算法可描述为:

在参数空间中的策略规划

image.png

 在最终的策略选择上,作者还比较了模型预测控制(MPC)和策略直接控制两种方法。


策略提炼


  作者用模仿学习来获取规划的策略,数据来自与MPC采用的最好的动作与真实环境的交互。模仿学习有很多方法,最简单的就是behavior cloning算法:

image.png

我们也可以采用GAN网络来训练一个策略网络:

image.png

通过模型学习算法学习planning采样中比较好的算法,然后渐渐地使得整个算法变得更强。

代码实现

  1. tensorflow实现https://github.com/WilsonWangTHU/POPLIN

取得的效果?

  可以看到POPLIN算法采样会有聚焦点的改变。

所出版信息?作者信息?


相关文章
|
4天前
|
存储 SQL 安全
网络安全与信息安全:构建安全防线的关键策略
本文深入探讨了网络安全与信息安全领域的核心要素,包括网络安全漏洞、加密技术以及安全意识的重要性。通过对这些关键领域的分析,旨在为读者提供一套综合性的防护策略,帮助企业和个人在日益复杂的网络环境中保障数据安全。
14 4
|
7天前
|
存储 安全 网络安全
云计算时代的网络安全挑战与应对策略
【9月更文挑战第26天】随着云计算技术的飞速发展,企业和用户越来越依赖云服务来处理数据和运行应用程序。然而,这种便利性也带来了新的网络安全风险。本文将探讨云计算环境中的网络安全挑战,并提供有效的应对策略,以帮助读者理解如何在享受云服务带来的便利的同时,保护好自己的信息安全。
31 5
|
8天前
|
监控 供应链 安全
汽车行业的网络安全危机与未来挑战:应对新兴威胁的全方位策略
汽车行业的网络安全危机与未来挑战:应对新兴威胁的全方位策略
|
13天前
|
机器学习/深度学习 人工智能 算法
鸟类识别系统Python+卷积神经网络算法+深度学习+人工智能+TensorFlow+ResNet50算法模型+图像识别
鸟类识别系统。本系统采用Python作为主要开发语言,通过使用加利福利亚大学开源的200种鸟类图像作为数据集。使用TensorFlow搭建ResNet50卷积神经网络算法模型,然后进行模型的迭代训练,得到一个识别精度较高的模型,然后在保存为本地的H5格式文件。在使用Django开发Web网页端操作界面,实现用户上传一张鸟类图像,识别其名称。
60 12
鸟类识别系统Python+卷积神经网络算法+深度学习+人工智能+TensorFlow+ResNet50算法模型+图像识别
|
2天前
|
SQL 安全 算法
数字时代的守护者:网络安全与信息安全的现代策略
【9月更文挑战第31天】在数字化时代,网络安全与信息安全成为保护个人隐私和企业资产的关键。本文将深入探讨网络安全漏洞的成因、加密技术的应用以及提升安全意识的重要性,旨在为读者提供防范网络威胁的策略和知识分享。
16 7
|
2天前
|
存储 安全 网络安全
云计算时代的网络安全:挑战与应对策略
【9月更文挑战第30天】在数字化浪潮的推动下,云计算已经成为企业和个人存储、处理数据的首选方式。然而,随着云服务的普及,网络安全问题也日益凸显。本文将深入探讨云计算环境下的网络安全挑战,并提出相应的应对策略。从云服务的基本概念出发,逐步揭示网络安全的重要性,并结合实例分析常见的网络攻击手段。同时,文章还将分享一些实用的安全措施和最佳实践,帮助读者构建更加安全的云环境。
|
1天前
|
存储 安全 网络安全
云计算浪潮之下的网络安全策略
【9月更文挑战第31天】随着数字化转型的加速,云计算已成为企业存储和处理数据的首选平台。然而,云服务的广泛应用也带来了前所未有的网络安全挑战。本文旨在深入分析云计算环境中的网络安全风险,并提出有效的防御策略。通过介绍云计算的基本概念、服务模型及其与网络安全的关系,文章探讨了云环境下的安全威胁和应对措施,包括加密技术、访问控制、身份认证等关键技术的应用。此外,还将分享几个保护云计算环境的实践案例,以期为企业在享受云计算便利的同时,提供坚实的网络安全保障。
10 4
|
3天前
|
存储 安全 网络安全
云计算与网络安全:探索云服务的安全挑战与应对策略
【9月更文挑战第29天】本文将深入探讨云计算环境下的网络安全问题,分析云服务中存在的安全威胁,并提出相应的防护措施。我们将从云基础设施、数据保护、身份管理等方面进行讨论,并提供一些实用的代码示例来展示如何增强云服务的安全性。
|
6天前
|
机器学习/深度学习 数据采集 网络安全
使用Python实现深度学习模型:智能网络安全威胁检测
使用Python实现深度学习模型:智能网络安全威胁检测
22 5
|
3天前
|
安全 网络安全 云计算
云计算与网络安全:技术挑战与策略
【9月更文挑战第29天】在数字化转型的浪潮中,云计算已成为企业IT架构的核心。然而,随着云服务的普及,网络安全问题也日益凸显。本文将探讨云计算环境下的网络安全挑战,包括数据泄露、服务中断等风险,以及相应的防护措施,如加密技术和访问控制。同时,文章还将介绍信息安全管理的最佳实践,如定期安全审计和员工培训,以提升企业的安全防护能力。
15 1
下一篇
无影云桌面