对策论包括三个方面的基本要素:对策主体、策略和得益。对策主体最少包括两个,对策问题的解指所有对策主体要使用的策略,按照这种策略能够实现使对策主体都满意的均衡状态。换句话说,对策主体使用各自的策略均能够保证本身的得益(如性能指标)达到最大或最优。对策论的平衡点称为鞍点。如果对策主体的运动模型为微分方程,则将对策问题称为微分对策。
根据最优控制方法(如LQR控制,LQG控制)求解得到的最优制导律总是假定目标机动方式是已知的,因此最优制导律也仅仅是在已知目标机动方式已知情况下是最优的,是一种单边最优策略。微分对策制导由于同时考虑了目标的最优机动问题,从原理上能够保证设计的制导律对任意目标机动具有最优性,但微分对策制导问题的求解难度也很大。
微分对策制导问题的一般描述。设拦截系统动力学模型为:
(1) |
式中为拦截系统的状态变量;
为导弹的机动控制变量;
为目标的机动控制变量。对策问题的目标函数为:
(2) |
微分对策制导问题描述:设计最优控制策略使下面的鞍点条件成立:
(3) |
式中。
可以看到,微分对策制导问题实质上是最优控制问题,最优策略应满足下面的哈密顿-雅可比-贝尔曼-埃萨克斯方程:
(4) |
对策问题的鞍点求解十分困难,通常将其化为双边最优控制问题进行处理。双边最优控制的哈密顿函数为:
(5) |
这样对策问题的鞍点求解问题就化为函数的鞍点求解问题,即选择最优策略
满足:
例子1:平面惯性坐标系拦截问题的拦截微分对策制导。
在平面惯性直角坐标系,导弹和目标的运动方程为:
(6) |
式中和
分别为沿坐标轴
方向,坐标轴
方向弹目的相对位置;
、
为分别沿坐标轴
方向和坐标轴
方向弹目的相对速度;
和
分别为导弹沿坐标轴
方向和坐标轴
方向的控制加速度;
和
分别为目标沿坐标轴
方向和坐标轴
方向的控制加速度。
,
,
和
彼此不相关。
如果取对策制导问题的指标函数为:
(7) |
式中为终端脱靶量权重;
和
分别为导弹和目标的控制量加权系数。则微分对策制导律和目标最优逃逸策略为:
(8) |
式中;
;
为剩余飞行时间,如果记
为命中点时刻,
为导弹拦截初始时刻,则
。
按照线性运动学模型和视线角速度关系,这种形式的微分对策制导律等价于变导航比的比例导引,导航比满足:
(9) |
当要求脱靶量最小时有,则:
(10) |
考虑到:
(11) |
这样脱靶量最小时导航比、导弹的最优控制加速度和目标的最优逃逸加速度
之间满足关系:
(12) |
例子2:如果在例子1中令,
,且有:
(13) |
指标函数为:
(14) |
则微分对策制导律和目标最优逃逸策略为:
(15) |
其中:
,
,
,
制导律优化参数,
应满足条件:
(16) |
定义,
。当要求脱靶量极小时
,对应比例导引项的导航比满足和弹目加速度比满足:
(17) |