博弈学习通信抗干扰理论与方法
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

3.2 连续策略条件下的贝叶斯Stackelberg博弈功率控制抗干扰

3.2.1 问题描述

考虑到信息的不确定性,假设用户不能获得关于信道增益β和代价Cs的完全信息,然而可以获得如假设 3.1 所示的分布信息。干扰不能获得关于信道增益α和代价C j的完全信息,仅仅可以获得如假设3.2所示的分布信息。

假设3.1:对用户来说,干扰链路信道增益βR个状态,其分别为β1 ,…,βr,…,βR。用户功率代价Cs具有H个状态,其分别为Cs1 ,…, Csh,…, CsH。二维离散随机变量(βCs)的联合概率分布为ηsβrCsh),并满足

假设3.2:对于干扰来说,发射链路增益αM个状态,其分别为α1 ,…,αm,…,αM。干扰功率代价Cj具有W个状态,其分别为Cj1,…,Cjw,…,CjW。二维离散随机变量(αCj)的联合概率分布为ηjαmCjw),并满足

考虑到干扰链路信道增益β和用户功率代价Cs的不确定性,式(3-1)所示的用户效用函数可改写为

类似地,考虑到发射链路信道增益α和干扰功率代价C j的不确定性,式(3-2)所示的干扰效用函数可改写为

在本节中,可将上述不完全信息条件下的功率控制抗干扰问题建模为一个贝叶斯Stackelberg 博弈。根据用户与干扰的运行关系,假设用户为领导者(Leader),而干扰为跟随者(Follower)。为了分析求解该博弈的Stackelberg均衡,采用经典的Stackelberg博弈分析方法——逆向递推法,即先分析下层子博弈,再分析上层子博弈。