发布网友 发布时间:2022-03-24 06:02
共3个回答
热心网友 时间:2022-03-24 07:32
个人认为动态规划可以分为三个大的阶段,以创立者Bellman为划分界限,一是前Bellman时代,二是Bellman时代,三是后Bellman时代。
1.前Bellman时代
20世纪40年代,许多经济学和统计学领域的学者发现逆序归纳法(backward inction)可以解决一些含风险和不去定性的多阶段决策问题。von Neumann和Morgenstern在他们的博弈论研究中,用逆序归纳法找到了扩展性博弈的子博弈精炼均衡(subgame perfect equilibria of extensive form games)。
统计决策理论(statistical decision theory)的创立者Abraham Wald也将其理论应用到多阶段决策问题。之后,Arrow,Blackwell和Girshick研究了统计决策问题的一般形式,用现代动态规划的方法阐明并解决了这一问题。
另外,Arrow, Harris 和Marschak 还用逆序归纳法研究过最优库存策略(optimal inventory policy)。
2.Bellman时代
几乎同一时期,也就是20世纪40年代末开始,Richard Bellman逐渐发现了多阶段决策问题的背后结构,并指出逆序归纳法到底是如何求解一大类多阶段决策问题的。从1949年开始,Bellman在兰德公司(RAND Corporation)开始了他对动态规划的研究,当时尚没有动态规划这一名词,此称呼是后来Bellman命名的。
Bellman最为核心的工作就是给出了动态规划的最优性原理。此处有重要的文献,即1953,1954年发表在Bull. Amer. Math. Soc.和Operations Research上的几篇重要论文,包括像The theory of dynamic programming,Some Applications of the Theory of Dynamic Programming-A Review。具有标志性意义的是1957年Princeton University Press出版的Dynamic Programming,这标志着动态规划理论的正式建立。
之后,Bellman的研究一直活跃到20世界60年代,其间对于动态规划应用范围的扩展做了一系列的研究工作,也有不少重要论文,此处不再罗列。
3.后Bellman时代
在基本的理论体系建立之后,动态规划进入了一个全面发展的时期,研究工作也有多个方向,总结来看,一是理论体系的一般化,二是修正原有理论的某些条件,包括像最优性原理来适应某些特殊的新问题。
这一阶段的研究工作相当庞杂,此处很难一一罗列,简单举几个分支。一是对于所谓维数灾的研究,二是在大规模可分非线性整数规划问题中的应用,三是模糊动态规划,四是与其他数学领域像偏微分方程的交叉研究等等。
此种划分纯粹是在下出于历史先后上的考虑而作出的,从学科内容上来说,可能不太合理。但是对于初级研究者理清基本脉络我想是有帮助的。来自:求助得到的回答
热心网友 时间:2022-03-24 08:50
楼上很是强大呀,这么专业。。。
热心网友 时间:2022-03-24 10:24
SD