贝尔曼拟谱法
贝尔曼拟谱法(Bellman pseudospectral method)是针对最优控制的拟谱法,以贝尔曼方程为基础,是I. Michael Ross提出拟谱最佳控制中的一部分[1]。此方法得名自理查德·贝尔曼,是由I. Michael Ross开始使用[2][3],一开始是用来求解多尺度的最佳控制问题,后来扩展到一般最佳问题的次佳解。
理论基础
[编辑]贝尔曼拟谱法的多尺度版本是以Ross–Fahroo拟谱法的谱收敛特性为基础。因为Ross–Fahroo拟谱法会快速的以指数型式收敛,可以在只有非常少节点的情形下达到解的点收敛,而其解还有很多高频的成分。最佳控制的混叠现象一开始是由Ross等人发现的[2]。他们没有用一般信号处理中处理反混叠的技巧,而提出最佳控制的贝尔曼原则可以应用在收敛解上,找到各节点之间的资讯。因为Gauss–Lobatto节点在边界点会相当的密集,Ross等人认为若在初始条件附近的节点密度满足采样定理,可以用递回方式用一种称为贝尔曼分段(Bellman segments)的分段,求解最佳控制问题,得到完整的解[2]。
在此方法的扩展版本中,Ross等人[3]提出可以用此方式得到不一定是最佳解的可行解。此版本中,即使是知道解没有收敛到最佳化,也可以用贝尔曼拟谱法在更低密度的节点条件下求解。此条件下得到的是可行解。
贝尔曼拟谱法的一个重要特点是它会以原始的拟谱法以贝尔曼分段下求和的成本为基础,自动决定一些次最佳化的量测[2][3]。
计算效率
[编辑]贝尔曼拟谱法在计算上的优点之一是可以不用遵守节点的高斯分布。在标准的拟谱法中,节点会以高斯分布(有限时域会是Gauss-Lobatto,无限时域会是Gauss-Radau)。高斯分布在区间的中间会很稀疏(无限时域中的“中间”会有其他的定义方式),在边界则会很密集贝尔曼拟谱法的利用初始点节点累计的好处来对所到的解反混叠,不考虑其他的节点。因此最后节点的分布是非高斯及密集的,不过其计算方式仍维持稀疏的结构。
应用
[编辑]贝尔曼拟谱法最早是由Ross等人使用的[2],是要求解很有挑战性的低推力轨迹最佳化问题。此方法已成功的用来求解实际的问题,产生跨地球注入问题的高精度解,该问题是将太空舱从绕月轨道带到一个很小的地球接面位置,以便成功的重返地球[4][5]。
贝尔曼拟谱法最常用作Ross–Fahroo拟谱法产生的拟谱解的最佳性确认。除了使用庞特里亚金最大化原理配合Ross–Fahroo拟谱法的解之外,贝尔曼拟谱法也用来做为其解最佳性的初步确认[6][7]。
相关条目
[编辑]参考资料
[编辑]- ^ Ross, I. M.; Karpenko, M. A Review of Pseudospectral Optimal Control: From Theory to Flight. Annual Reviews in Control. 2012, 36: 182–197 [2019-01-12]. doi:10.1016/j.arcontrol.2012.09.002. (原始内容存档于2015-09-24).
- ^ 2.0 2.1 2.2 2.3 2.4 Ross, I. M.; Gong, Q.; Sekhavat, P. Low-Thrust, High-Accuracy Trajectory Optimization. Journal of Guidance, Control and Dynamics. 2007, 30 (4): 921–933. doi:10.2514/1.23181.
- ^ 3.0 3.1 3.2 I. M. Ross, Q. Gong and P. Sekhavat, The Bellman pseudospectral method, AIAA/AAS Astrodynamics Specialist Conference and Exhibit, Honolulu, Hawaii, AIAA-2008-6448, August 18–21, 2008.
- ^ Yan, H.; Gong, Q.; Park, C.; Ross, I. M.; D'Souza, C. N. High Accuracy Trajectory Optimization for a Trans-Earth Lunar Mission. Journal of Guidance, Control and Dynamics. 2011, 34 (4): 1219–1227. doi:10.2514/1.49237.
- ^ H. Yan, Q. Gong, C. D. Park, I. M. Ross and C. N. D'Souza, High-Accuracy Moon to Earth trajectory optimization, AIAA Guidance, Navigation, and Control Conference, 2010.
- ^ Fleming, A.; Sekhavat, P.; Ross, I. M. Minimum-Time Reorientation of a Rigid Body. Journal of Guidance, Control and Dynamics. 2010, 33 (1): 160–170. doi:10.2514/1.43549.
- ^ Ross, I. M.; Sekhavat, P.; Fleming, A.; Gong, Q. Optimal feedback control: foundations, examples, and experimental results for a new approach. Journal of Guidance, Control, and Dynamics. 2008, 31 (2): 307–321. doi:10.2514/1.29532.