预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共104页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

第六章序贯决策分析第一节多阶段决策第一节多阶段决策第一节多阶段决策第一节多阶段决策第一节多阶段决策第一节多阶段决策第一节多阶段决策第一节多阶段决策第二节序贯决策例6-3设有某石油勘探队,在一片估计能出油的荒田钻探,可以先做地震试验,然后决定钻井与否。或者不做地震试验,只凭经验决定钻井与否。做地震试验的费用每次30000元,钻井费用为10000元。若钻井后出油,这井队可收入40000元;若不出油就没有任何收入。各种情况下出油的概率已估计出,并标在图6-2上。问钻井队的决策者如何做出决策使收入的期望值为最大。 第二节序贯决策即在系统发展的不同时刻(或阶段)根据系统所处的状态,不断地做出决策;动态规划问题的典型例子: 1.生产决策问题:企业在生产过程中,由于需求是随时间变化的,因此企业为了获得全年的最佳生产效益,就要在整个生产过程中逐月或逐季度地根据库存和需求决定生产计划。2.最短路问题:给定一个交通网络图如下,其中两点之间的数字表示距离(或花费),试求从A点到G点的最短距离(总费用最小)。(一)、基本概念 1、阶段: 把一个问题的过程,恰当地分为若干个相互联系的阶段,以便于按一定的次序去求解。 描述阶段的变量称为阶段变量。阶段的划分,一般是根据时间和空间的自然特征来进行的,但要便于问题转化为多阶段决策。 3、决策:表示当过程处于某一阶段的某个状态时,可以作出不同的决定,从而确定下一阶段的状态,这种决定称为决策。6、状态转移方程:是确定过程由一个状态到另一个状态的演变过程,描述了状态转移规律。(二)、建立动态规划模型的步骤 1、划分阶段 划分阶段是运用动态规划求解多阶段决策问题的第一步,在确定多阶段特性后,按时间或空间先后顺序,将过程划分为若干相互联系的阶段。对于静态问题要人为地赋予“时间”概念,以便划分阶段。 2、正确选择状态变量 选择变量既要能确切描述过程演变又要满足无后效性,而且各阶段状态变量的取值能够确定。一般地,状态变量的选择是从过程演变的特点中寻找。 3、确定决策变量及允许决策集合 通常选择所求解问题的关键变量作为决策变量,同时要给出决策变量的取值范围,即确定允许决策集合。4、确定状态转移方程 根据k阶段状态变量和决策变量,写出k+1阶段状态变量,状态转移方程应当具有递推关系。 5、确定阶段指标函数和最优指标函数,建立动态规划基本方程 阶段指标函数是指第k阶段的收益,最优指标函数是指从第k阶段状态出发到第n阶段末所获得收益的最优值,最后写出动态规划基本方程。 例1、从A地到D地要铺设一条煤气管道,其中需经过两级中间站,两点之间的连线上的数字表示距离,如图所示。问应该选择什么路线,使总距离最短?解:整个计算过程分三个阶段,从最后一个阶段开始。 d(B1,C1)+f1(C1)3+1 f2(B1)=mind(B1,C2)+f1(C2)=min3+3 d(B1,C3)+f1(C3)1+4 4 =min6=4 5 d(B2,C1)+f1(C1)2+1 f2(B2)=mind(B2,C2)+f1(C2)=min3+3 d(B2,C3)+f1(C3)1+4 3 =min6=3 5第三阶段(A→B):A到B有二条路线。A例2:k=5,出发点E1、E2、E3k=4,u1(A)=B1求从A到E的最短路径练习1:第三节马尔可夫决策第三节马尔可夫决策在经济现象中存在一种“无后效性”。即“系统在每一时刻的状态仅仅取决于前一时刻的状态,而与其过去的历史无关。”第三节马尔可夫决策第三节马尔可夫决策例1某地区有甲、乙、丙三家食品厂生产同一食品,有1000个用户(或购货点),假设在研究期间无新用户加入也无老用户退出,只有用户的转移,已知2002年5月份有500户是甲厂的顾客;400户是乙厂的顾客;100户是丙厂的顾客。6月份,甲厂有400户原来的顾客,上月的顾客有50户转乙厂,50户转丙厂;乙厂有300户原来的顾客,上月的顾客有20户转甲厂,80户转丙厂;丙厂有80户原来的顾客,上月的顾客有10户转甲厂,10户转乙厂。试计算其状态转移概率。状态转移矩阵第三节马尔可夫决策第三节马尔可夫决策第三节马尔可夫决策第三节马尔可夫决策第三节马尔可夫决策第三节马尔可夫决策思考题第四节群决策简介第四节群决策简介第四节群决策简介第四节群决策简介第四节群决策简介第四节群决策简介第四节群决策简介第四节群决策简介第四节群决策简介第四节群决策简介第四节群决策简介第四节群决策简介第四节群决策简介第四节群决策简介例6-9,P206第四节群决策简介第四节群决策简介第四节群决策简介第四节群决策简介第四节群决策简介第四节群决策简介德尔菲法应用案例专家 编号专家 编号平均值预测: 在预测时,最终一次判断是综合前几次的反馈做出的,因此在预测时一般以最后一次判断为主。则如果按照8位专家第三次判断