《中国人工智能学会通讯》——11.34 基于近似动态规划的优化控制研究及 在电力系统中的应用

简介: 本节书摘来自CCAI《中国人工智能学会通讯》一书中的第11章,第11.34节, 更多章节内容可以访问云栖社区“CCAI”公众号查看。

11.34 基于近似动态规划的优化控制研究及 在电力系统中的应用

上世纪 50 年代以来,在空间技术发展和数字计算机实用化的推动下,动态系统的优化理论得到了迅速的发展,形成了一个重要的学科分支——最优控制[1-2] 。它在空间技术、系统工程、多级工艺设备的优化等领域都有越来越广泛的应用。因而更深入研究最优控制问题,无论在理论上,还是在实践上都具有重大的意义。最优控制理论的三大基石是经典变分理论、极小值原理及动态规划。经典变分理论只能解决控制无约束问题,即容许控制属于开集的一类最优控制问题,而工程实践中所遇到的多是容许控制为闭集的一类最优控制问题。对于这一类问题 , 经典变分理论变得无能为力。因而为了适应工程实践的需要,20 世纪 50 年代中期出现了现代变分理论,一种是苏联学者庞特里亚金的“极小值原理” [3] ;另一种是美国学者贝尔曼的“动态规划 (DynamicProgramming,DP)” [4] 。极小值原理不仅适用于处理带开集性约束条件的最优控制问题,而且也适用于处理带有闭集约束条件的最优控制问题。但是对于非线性系统,极小值原理需要求解非线性两点边值问题。这一点在工程实际中很难做到的,一般无法求得最优控制的解析解。

动态规划不仅能处理带有开集性约束条件的最优控制问题, 而且也能处理带有闭集约束条件的最优控制问题,而更为重要的是其给出最优控制的充分条件。但是,动态规划的明显弱点是,计算量和存储量会随着状态和控制向量的维数增加而急剧增加。对于状态向量为 n 维、控制向量为 m 维、时间离散段为 N 的离散系统,在状态向量的每个元取 p个值,控制向量的每个元取 q 个值的情况下,计算性能指标的求值次数为 Np n q m 次 , 需要存储容量为2p n 个字。假定取 N=10、p=q=20、n=6、m=2, 则需要存储量为 1.28 亿字 , 计算次数为 2 560 亿次。很显然,这种巨大的计算量形成了所谓的“维数灾”问题[4] ,极大限制了动态规划的直接应用。

为了解决动态规划的“维数灾”问题,Werbos于 1977 年 提 出 了 近 似 动 态 规 划 (Approximatedynamic programming, ADP) 的基本理论思想[5] ,随后许多学者也开始探讨这方面的问题 , 使得 ADP 理论得到了极大的发展[6-13] 。在 ADP 发展过程中出现了一系列的同义词,如自适应评价设计[6-8] 、自适应动态规划[9] 、增强学习 [10] 、神经动态规划 [11]和启发式动态规划[12]等。2006 年美国科学基金会组织的“2006 NSF Workshop and Outreach Tutorials onApproximate Dynamic Programming”研讨会上 , 建议将该方法统称为“Adaptive/Approximate dynamicprogramming”。 这次专题讨论会奠定了 ADP 在相关研究领域中的重要地位。

近似动态规划是通过利用函数近似结构来近似动态规划中的性能指标函数以及控制函数,利用强化学习机制而来获得最优性能指标函数和最优控制以满足动态规划的最优性原理。近似动态规划的基本思想可用图 1 来说明。近似动态规划的整体结构主要由动态系统 (Dynamic system)、执行 / 控制 (Action/Control) 和评价 / 性能指标函数 (Critic/Performance index function) 三部分组成。每个部分均可由神经网络代替,称为模型网络、评价网络和执行网络。评价网络和执行网络二者的结合相当于一个智能体 (Agent),控制 (Action) 作用于动态系统( 或者被控对象 ) 后,通过被控对象 ( 或者环境 ) 在不同阶段产生的奖励 / 惩罚 (Reward/Penalty) 来影响性能指标函数[7] 。智能体的任务就是学习一个控制策略,使得这些回报(或者惩罚)的总和达到最优。正是由于近似动态规划利用函数近似结构 ( 比如神经络[5] ) 来逼近动态规划方程中的代价函数和控制策略,以满足最优性原理,从而获得最优代价函数和最优控制策略,因而克服了 DP 方法局限性。

image

相关文章
|
7天前
|
机器学习/深度学习 人工智能 算法
基于Python深度学习的眼疾识别系统实现~人工智能+卷积网络算法
眼疾识别系统,本系统使用Python作为主要开发语言,基于TensorFlow搭建卷积神经网络算法,并收集了4种常见的眼疾图像数据集(白内障、糖尿病性视网膜病变、青光眼和正常眼睛) 再使用通过搭建的算法模型对数据集进行训练得到一个识别精度较高的模型,然后保存为为本地h5格式文件。最后使用Django框架搭建了一个Web网页平台可视化操作界面,实现用户上传一张眼疾图片识别其名称。
23 4
基于Python深度学习的眼疾识别系统实现~人工智能+卷积网络算法
|
9天前
|
机器学习/深度学习 人工智能 运维
人工智能在事件管理中的应用
人工智能在事件管理中的应用
52 20
|
16天前
|
机器学习/深度学习 人工智能 自动驾驶
企业内训|AI大模型在汽车行业的前沿应用研修-某汽车集团
本课程是TsingtaoAI为某汽车集团高级项目经理设计研发,课程全面系统地解析AI的发展历程、技术基础及其在汽车行业的深度应用。通过深入浅出的理论讲解、丰富的行业案例分析以及实战项目训练,学员将全面掌握机器学习、深度学习、NLP与CV等核心技术,了解自动驾驶、智能制造、车联网与智能营销等关键应用场景,洞悉AI技术对企业战略布局的深远影响。
164 97
|
6天前
|
机器学习/深度学习 人工智能 算法
AI在体育分析与预测中的深度应用:变革体育界的智能力量
AI在体育分析与预测中的深度应用:变革体育界的智能力量
62 31
|
2天前
|
人工智能 运维 负载均衡
智能运维新时代:AI在云资源管理中的应用与实践
智能运维新时代:AI在云资源管理中的应用与实践
55 23
|
14天前
|
机器学习/深度学习 人工智能 自然语言处理
CogAgent-9B:智谱 AI 开源 GLM-PC 的基座模型,专注于预测和执行 GUI 操作,可应用于自动化交互任务
CogAgent-9B 是智谱AI基于 GLM-4V-9B 训练的专用Agent任务模型,支持高分辨率图像处理和双语交互,能够预测并执行GUI操作,广泛应用于自动化任务。
65 12
CogAgent-9B:智谱 AI 开源 GLM-PC 的基座模型,专注于预测和执行 GUI 操作,可应用于自动化交互任务
|
9天前
|
机器学习/深度学习 人工智能 监控
AI在交通管理系统中的应用
AI在交通管理系统中的应用
50 23
|
6天前
|
人工智能 算法 搜索推荐
阿里云百炼xWaytoAGI共学课开课:手把手学AI,大咖带你从零搭建AI应用
阿里云百炼xWaytoAGI共学课开课啦。大咖带你从零搭建AI应用,玩转阿里云百炼大模型平台。3天课程,涵盖企业级文本知识库案例、多模态交互应用实操等,适合有开发经验的企业或独立开发者。直播时间:2025年1月7日-9日 20:00,地点:阿里云/WaytoAGI微信视频号。参与课程可赢取定制保温杯、雨伞及磁吸充电宝等奖品。欢迎加入钉钉共学群(群号:101765012406),与百万开发者共学、共享、共实践!
|
20天前
|
人工智能 前端开发 Java
Spring AI Alibaba + 通义千问,开发AI应用如此简单!!!
本文介绍了如何使用Spring AI Alibaba开发一个简单的AI对话应用。通过引入`spring-ai-alibaba-starter`依赖和配置API密钥,结合Spring Boot项目,只需几行代码即可实现与AI模型的交互。具体步骤包括创建Spring Boot项目、编写Controller处理对话请求以及前端页面展示对话内容。此外,文章还介绍了如何通过添加对话记忆功能,使AI能够理解上下文并进行连贯对话。最后,总结了Spring AI为Java开发者带来的便利,简化了AI应用的开发流程。
265 0
|
6天前
|
存储 人工智能 监控
AI视频监控技术在公租房管理中的应用:提升监管精准度与效率
该AI视频监控系统具备1080P高清与夜视能力,采用深度学习技术实现高精度人脸识别(误识率1%),并支持实时预警功能,响应时间小于5秒。系统支持私有化部署,保障数据隐私安全,适用于大规模公租房社区管理,可容纳10万以上人脸库。基于开源架构和Docker镜像,一键部署简单快捷,确保24小时稳定运行,并提供详细的后台数据分析报表,助力政府决策。