1、题目翻译
基于深度强化学习的能量感知卫星切换
2、来源
Energy-Aware Satellite Handover Based on Deep Reinforcement Learning | IEEE Conference Publication | IEEE Xplore
23-12
3、内容
场景:由于LEO卫星的高速移动,UE在服务期间会经历多次切换( HO ),这种情况如果广泛发生,会对UE的服务质量( QoS )产生不利影响。卫星HO策略必须有效地利用有限的可用卫星资源,并在尊重每个UE的各种任务类型(TP Traffic Profiles)的同时防止网络拥塞。包括视频、监控之类的,每种类型需要的资源不同。本文的主要目标是确定在HO事件期间,每个用户应该连接到哪颗卫星,从而减少后续不必要的切换,同时有效地利用可用的卫星信道和能量资源。效果:解决了LEO卫星能量资源受限和UE性能需求多样化的问题。方法:深度强化学习。方案:状态<用户与卫星之间的覆盖指标,加载信道数,可用能量,剩余可视时间RVT>,5种不同的奖励函数:(1)有HO连接到资源不足/足的卫星,(2)没有HO,不阻塞;信道或资源不足;与资源充足的卫星保持连接。几个点:(1)对用户不同的任务分类,不同类型任务需要的资源不同。(2)HO考虑的参数。
单一的HO准则:
自由信道数。均匀负载,但是大量HO,不稳定,频繁中断
最大剩余可视时间。能最大限度的降低HO频率,但是每个用户高阻塞率
于天线增益的HO方法,利用卫星运动的可预测性和卫星波束的天线增益,以防止服务失败和不良HO发生
博弈
接收信号强度( Received Signal Strength,RSS )。大量的UE可能连接到具有最佳RSS的卫星,从而导致访问拥塞和卫星之间的过度负载不平衡
不单一:
考虑服务时间、通信信道资源和中继开销的RL技术。目的是优化UE的体验质量( QoE )
考虑载波噪声和干扰噪声比来最小化卫星HO的频率,同时降低HO的失效概率。RL
二、A Reliable Handover Strategy with Second Satellite Sele