第五章 动态规划 
第一节 第二节 第三节

第一节 多阶段决策问题     (1) (2) (3)
    5.策略
    在一个多阶段决策过程中,如果各个阶段的决策变量() (k=1,2,…,n)都已确定,则整个过程也就完全确定。称决策序列为该过程的一个策略,从阶段k到阶段n的决策序列称为子策略,表示成。如例1中,选取一路线 就是一个策略:
    由于每一阶段都有若干个可能的状态和多种不同的决策,因而一个多阶段决策的实际问题存在许多策略可供选择,称其中能够满足预期目标的策略为最优策略。例1中存在12条不同路线,其中是最短线路。
    6.指标函数
    用来衡量过程优劣的数量指标,称为指标函数。在阶段k的状态下执行决策,不仅带来系统状态的转移,而且也必然对目标函数给予影响,阶段效应就是执行阶段决策时给目标函数的影响。
    多阶段决策过程关于目标函数的总效应是各阶段的阶段效应累积形成的。常见的全过程目标函数有以下两种形式:
    (1)全过程的目标函数等于各阶段目标函数的和,即:
        
    (2)全过程的目标函数等于各阶段目标函数的积,即:
        
    指标函数的最优值,称为最优函数值。一般,f1(x1)表示从第1阶段x1状态出发至第n阶段(最后阶段)的最优指标函数, fk()表示从第k阶段状态出发至第n阶段的最优指标函数(k=1,2,…,n)。