预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共43页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

动态规划(DynamicProgramming)教学大纲:1例2:生产与投入问题包含随时间变化的因素和变量的系统。多阶段决策问题的典型例子: 1.生产决策问题:企业在生产过程中,由于需求是随时间变化的,因此企业为了获得全年的最佳生产效益,就要在整个生产过程中逐月或逐季度地根据库存和需求决定生产计划。这时,机器的年完好率为a,即如果年初完好机器的数量为u,到年终完好的机器就为au,0<a<1。3.航天飞机飞行控制问题:由于航天飞机的运动的环境是不断变化的,因此就要根据航天飞机飞行在不同环境中的情况,不断地决定航天飞机的飞行方向和速度(状态),使之能最省燃料和实现目的(如软着落问题)。11最短路的特性:如果已有从起点到终点的一条最短路,那么从最短路线上中间任何一点出发到终点的路线仍然是最短路。(证明用反证法)第二步:k=3,状态变量可取三个值④、⑤、⑥,这是经过一个中途点到达终点E的两级决策问题,从城市④到E有两条路线,需加以比较,取其中最短的,即:即城市⑤到终点最短距离为5,其路径为⑤→⑧→E。相应决策为第三步:k=2,这是具有三个初始状态①、②、③,要经过两个中途站才能到达终点的三级决策问题。由于第3段各点④,⑤,⑥到终点E的最短距离已知,所以我们若求城市①到E的最短距离,只需以它们为基础,分别加上城市①与④、⑤、⑥的一段距离,加以比较取其短者即可。同理有:第四步k=1,只要一个状态A,则:再按计算顺序反推可得最优决策序列{}即:用动态规划(逆序法求解的)基本特性:求解的各个阶段,我们利用了k阶段与k+1阶段之间的递推关系:一般情况,k阶段与k+1阶段的递推关系式(动态规划基本方程)但要便于把问题的过程能转化为多阶段决策的过程。在实际问题中决策变量的取值往往在某一范围之内,此范围称为允许决策集合。常用Dk(sk)表示第k阶段从状态sk出发的允许决策集合,显然有由每段的决策按顺序排列组成的决策函数序列称为k子过程策略,系统在某一阶段的状态转移不但与系统的当前的状态和决策有关,而且还与系统过去的历史状态和决策有关。其状态转移方程如下(一般形式)1如果状态变量不能满足无后效性的要求,应适当地改变状态的定义或规定方法。它是定义在全过程或所有后部子过程上确定的数量函数。常见的指标函数的形式是:过程和它的任意子过程的指标是它所包含的各阶段的指标的乘积。即 多阶段决策过程的数学模型:(具有无后效性)小结:解多阶段决策过程问题,求出问如何分配投资数额才能使总效益最大?状态转移方程当阶段k=2时,有一般动态规划应用动态规划的优缺点此课件下载可自行编辑修改,供参考! 感谢您的支持,我们努力做得更好!