运筹学

§ 2 动态规划的基本概念和最优化原理

    多阶段决策过程的特点是每个阶段都要进行决策，具有n个阶段的决策过程的策略是由n个相继进行的阶段决策构成的决策序列。由于前阶段的终止状态又是后一阶段的初始状态，因此确定阶段最优决策不能只从本阶段的效应出发，必须通盘考虑，整体规划。就是说，阶段k的最优决策不应只是本阶段的最优，而必须是本阶段及其所有后续阶段的总体最优，即关于整个后部子过程的最优决策。

    对此，贝尔曼在深入研究的基础上，针对具有无后效性的多阶段决策过程的特点，提出了著名的多阶段决策的最优性原理：

    “整个过程的最优策略具有这样的性质：即无论过程过去的状态和决策如何，对前面的决策所形成的状态而言，余下的诸决策必须构成最优策略。”

     简而言之，最优性原理的含意就是：最优策略的任何一部分子策略也必须是最优的。

如例1，

是由A到E的最短路线，我们在该路线上任取一点

，按照最优性原理

应该是

到E的最短路。很容易用反证法证明这一结论的正确性，从而说明最优性原理的正确性。

按最优性原理，可以将例1分成A—B—C—D—E 4个阶段，由后向前逐步求出各点到E的最短线路，直至求出A至E的最短线路。

例1的路线图

K=4时，出发点有D1，D2，D3，记

	f4（Di）（i=1,2,3）为Di到E的最短距离；u4(Di)表示从状态Di出发采取的决策。显然：
	f4（D1）=7，u4(D1)=E f4（D2）=8，u4(D2)=E f4（D3）=6，u4(D3)=E