目录第1章 理论基础与对抗环境建模1.1 认知雷达感知-行动循环的数学抽象1.1.1 动态数据信息处理(DDIP)范式形式化定义1.1.1.1 感知模块:贝叶斯跟踪器的状态空间表示1.1.1.2 行动模块:波形选择与波束调度的决策空间1.1.1.3 闭环反馈:从感知π到行动a的映射函数G_{π,a}1.1.2 对抗性逆学习问题的不可观测性分析1.1.2.1 隐藏状态:认知雷达内部信念π的不可观测性约束1.1.2.2 黑盒策略:感知-行动策略的条件概率分布p(a|π)1.1.2.3 观测变量:目标运动学状态x与雷达行动a的可见性边界1.2 传统逆学习框架的局限性解构1.2.1 先验知识依赖型方法的形式化缺陷1.2.1.1 已知策略假设:贝叶斯逆滤波的感知估计局限1.2.1.2 已知感知假设:逆强化学习的策略重构盲区1.2.1.3 单一推断的误差传播:级联不确定性分析1.2.2 对抗环境的实时性约束1.2.2.1 在线学习需求的非参数化动机1.2.2.2 策略动态变化的非平稳性处理第1章 理论基础与对抗环境建模1.1 认知雷达感知-行动循环的数学抽象认知雷达区别于传统雷达系统的本质特征在于其具备闭环反馈机制。这类系统能够根据外部环境的实时变化动态调整发射参数,形成从环境感知到决策执行的完整循环。动态数据信息处理范式为该循环提供了形式化描述框架