chapter05

第五章动态规划

第一节

第二节

第三节

第三节建立动态规划数学模型的步骤     (1) (2) (3) (4)
    “最优化原理”是动态规划的核心,所有动态规划问题的递推关系都是根据这个原理建立起来的,并且根据递推关系依次计算,最终可求得动态规划问题的解。
    一般来说，利用动态规划求解实际问题需先建立问题的动态模型，具体步骤如下：
    ⒈将问题按时间或空间次序划分成若干阶段。有些问题不具有时空次序，也可以人为地引进时空次序，划分阶段。
    ⒉正确选择状态变量。这一步是形成动态模型的关键，状态变量是动态规划模型中最重要的参数。一般来说，状态变量应具有以下三个特性：
    ⑴要能够用来描述决策过程的演变特征。
    ⑵要满足无后效性。即如果某阶段状态已给定后，则以后过程的进展不受以前各状态的影响，也就是说，过去的历史只通过当前的状态去影响未来的发展。
    ⑶递推性。即由k阶段的状态变量及决策变量uk可以计算出k+1阶段的状态变量。
    ⒊确定决策变量及允许决策变量集合Dk()。
    ⒋根据状态变量之间的递推关系，写出状态转移方程： =T(, ())
    ⒌建立指标函数。一般用rk(, )描写阶段效应，fk（）表示k—n阶段的最优子策略函数。
    ⒍建立动态规划基本方程：

    以上是建立动态规划模型的过程，这个过程是正确求解动态规划的基础。