第五章 动态规划 
第一节 第二节 第三节

第一节 多阶段决策问题     (1) (2) (3)
    1.2 动态规划的基本概念
    1.阶段
    动态规划问题通常都具有时间或空间上的次序性,因此求解这类问题时,首先要将问题按一定的次序划分成若干相互联系的阶段,以便能按一定次序去求解。如例1,可以按空间次序划分为A—B—C—D—E 4个阶段,而例2,按照时间次序可分成5个阶段。
    2.状态
    在多阶段决策过程中,每阶段都需要作出决策,而决策是根据系统所处情况决定的。状态是描述系统情况所必需的信息。如例1中每阶段的出发点位置就是状态,例2中每年初拥有的完好机床数是作出机床负荷安排的根据,所以年初完好机床数是状态。一般地,状态可以用一个变量来描述,称为状态变量。记第k 阶段的状态变量为,k=1,2, …,n.
    3.决策
    多阶段决策过程的发展是用各阶段的状态演变来描述的,阶段决策就是决策者从本阶段某状态出发对下一阶段状态所作出的选择。描述决策的变量称为决策变量,当第k 阶段的状态确定之后,可能作出的决策要受到这一状态的影响。这就是说决策变量还是状态变量 的函数,因此,又可将第k阶段状态下的决策变量记为()。
    在实际问题中,决策变量的取值往往限制在某一范围之内,此范围称为允许决策变量集合,记作Dk()。如例2中取高负荷运行的机床数为决策变量,则0≤是k阶段初完好机床数)为允许决策变量集合。
    4.状态转移方程
    在多阶段决策过程中,如果给定了k 阶段的状态变量和决策变量,则第k+1阶段的状态变量也会随之而确定。也就是说函数,这种关系可记为 =T(,) 称之为状态转移方程。