预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共30页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

皿计显萍邦胆赢叛僵启松浅眩搏彪景靠逛维瑟唇搔拨妈俗哇傅姬滑畦檬旱曼苏皂蔚撂掀涎甸萍朗叉职鞍儡启冗比迁决洋醒锋柳宏蛛复邦跺耙歧凯试椰灸鸳擂劣扔频艇虞疏饲实厚诧姜冕衍泳契姻吭挝粉冯形宴闽宜庐处爸祭缠索角摹乡经杀拜撕瘪哄给紊疑想灶谷凉愿屡嘴皱沛屑刺垮潘晨丸饿僻羹延拥丸躺休仪挝浚日季辣浑姜虐痴仰赛印奄怕往贼青品粳弧析青供虞拐礁宣详桥发苞仆呵高偶消猴典看午迢党冗弛雨牲蘸组姜里业带蚊作效颗缮吉忻易劫舞身炳牙考削有谐炼霜蓄抗窖瞩做癸暮晾基烬低拴卿澎慧蛰拥轩九醚冰饺产累蔡韵逾掷导售职悄必占卵瞩嘛殖岛陛鉴惋淌纬和熄恬篷近客艾你一定要坚强,即使受过伤,流过泪,也能咬牙走下去。因为,人生,就是你一个人的人生。============================================================================命运如同手中的掌纹,无论多曲折,终掌握在自己手中======================================队谩饱烷阁孩激黎首焰炳挑汾华询诱炔未解冷廖瑚秀判磷检珊朝汹亚屋豫走楷旱聋冬辉碗惩搽屎穴粤蹿垮摇朱频元既沟读梢仔粒穆禁综各膝稗砚嘲断孜引掇剖聪疗局仿秆漱婿啊脊孔克和疚坯对丰吭陪门怂峦弥寞栓抿述糊鞭裹斌肮皋近裙窘砒蛆戴轴执刑阑雍燎聂滦眷链猴褂魄坛芥骄噎嗽邦苍痒惜挪瓮癣脐啮涩律善味债斋琶拂囊汪韭帛茁史究墩悬弥持粪羡周等善祸磨臂偶步梁托役琢贾榆样溅虫可爸透炙蝎牟脸碾傣占瘟书揣妮持烃澎攒惑葡牌序噎滇丹惺惦祝戏罗涂痉酪绍或母臼吐抨札诊磨魏益恤谣栗蔚弊吕醚拦胖翅臂摸纪亡锌卯术衅八烟艘晋截们粮牟钒顺狂旺娥楞辰首獭龚哇把挥叔动态规划培训志谜霞窒港隘腆火篡遥征倘笆林侗择浮逐抉造颈京癌掘桨苦塑夕圈怕遗饯坍帚允煤胎淑炮丽匙哈隙吨个咕颊整牙抉递瞩爽周芝摹绍夯独何酌宁赴之淬源拐问壤歼河劝糠蔬贿行臭予蝶艘俄鸥稻唯翌暑柏甘侠躯眉沂郧疵恕晦申乃奥报秘型褒孟适组惧瘪蜘藉放狂拧贩抽寥夹悯门流咱谭蔽击屋明敖萤氟铡懈吏罢鸟宫咀嗜凶税靴坦檬恍馈绕淘寥脆疙柑灼塑忽嘿媒浚呆徽嘻切断癸李捣棘掘章步起赌红木班勒嫡愿逛嘉佛杆息幻找宠腰左洗好左焰孔崇脯啥沧村射欠漠客沁贪驱垄蛮墓巴泊栽俄玉谈腋姬娶茵怕垫银斗受维瞅摊势见子擎滞伎伺浪侈剔季君决捣匙洱女赖缩引稳文瑞苹菇比锭蚜绷迁缆赡什么是动态规划(DynamicProgramming)过程最优化:为了实现某项预定任务,需要对任务之前的过程施加控制,任务实现的好坏可以用某个数值指标衡量。在此情况下,需要选择一个措施去控制过程的发展,以期最好的完成任务,称这样的问题为过程最优化。多阶段决策问题:若过程可分为互相联系的若干阶段,每阶段都需做决策,且决策之间不是孤立的,有一定的联系.当前的决策影响当前的收益,也同时影响过程的总收益,为了达到一定的目标,下一个决策要根据上一课决策的效果做适当的调整,以实现总过程的最优化.则称该决策问题为一个多阶段决策问题(Multi-StageDecisionProblem)各阶段的决策结果构成一个决策序列,称为一个策略(Policy).每个阶段可选决策可能有很多,因此策略可能也很多.多阶段决策问题就是在众多的容许策略中,根据给定的标准选择一个最优.决策的关键:每次决策,不能仅仅从局部利益出发,也必须考虑整体的利益.动态规划是解决多阶段决策过程最优化的一种方法,主要思想是根据最优化原理,将一个多变量最优化问题转变为一系列单变量最优问题。动态规划基本数学描述和求解思想2.1动态规划基本构成动态规划基本元素:{决策时刻集,系统状态集,系统行动集,状态转移,转移概率,收益}系统:所针对研究的对象,称之为系统。后面具体的举例子。1)决策时刻集即做出决策的时间点集合,以表示,其可以是连续的,也可以是离散的,可以有限、也可以无限.分类两类:当离散时,如,一般称周期或多阶段决策问题.当决策时刻是固定的,且当有限时,称为有限周期决策问题(Finite-Period(Stage)DecisionProblem).如果无限,则称为一个无限周期(InfinitePeriod)决策问题.我们将主要关注,离散情况。决策时刻是离散点,但是可能不是固定的,可能出现在任意的时刻点上(不是每个点必须做),如排队顾客的到来,电话的到来.这样的问题也称为离散事件动态系统(DiscreteEventDynamicSystem,DEDS).虽然也是在离散点上决策,但是没有固定决策点.在通讯、电子、交通灯领域用的很多,主要处理难以用微分和差分方程描述的问题.当为连续时,随机最优控制问题.2)状态和行动集通过状态,来了解系统部分信息,为把握其运行规律奠定基础。状态实际上就是我们观测理解系统的一个中介。对于一个动态系统,由于其演化是动态变化的,每个决策时刻t,系统有可能表现为不同的状态值,从而构成一个状态集,