| 姓名:刘克著 作者简介: 作品:《南阳汉画像与生态民俗》《摄动马尔可夫决策与哈密尔顿圈》《金融英语》《证券投资学》《金融英语》 |
| 第一部分 马氏决策过程与摄动 第1章 绪论 人们在做决策的时候,不仅要考虑做决策当前的效果,也要照顾到所做的决策对长远利益的影响.正像一个长跑运动员,他要根据需要跑的距离而合理分配自己的体力,以避免尚未跑完全程就筋疲力尽.因此,做决策不是孤立的,也就是说今天的决策会影响到明天,而明天的决策会影响到将来,如果不顾及对将来的影响而只考虑当前的利益做决策,从长远的角度来看,效果不会很好。 本书涉及的马尔可夫决策过程是在不确定环境下的一类序列决策模型,决策者不仅要考虑决策结果的即时效应,还要考虑为将来继续做决策创造机会,也就是要考虑这次选择决策后对将来发展过程的影响.看上去这个模型似乎不复杂,但是它的应用极其广泛,而且产生了丰富的数学理论,这一章主要通过一些例子来说明决策的过程和动态,然后给出马尔可夫决策过程的一般记号与定义,最后叙述了马氏决策过程的发展简史和一些比较有影响的相关书籍。 1.1 序列决策模型 我们用图1.1描述多阶段决策过程的一个完整步骤,在时刻t,控制系统的决策者观察到系统当前所处的状态,并根据这个状态选取一个行动。…… 更多 |
| 总序 前言 主要符号表 第一部分 马氏决策过程与摄动 第1章 绪论 1.1 序列决策模型 1.2 马氏决策过程的例子 1.3 马氏决策过程的定义与记号 1.3.1 决策时刻与周期 1.3.2 状态与行动集 1.3.3 转移概率和报酬 1.3.4 历史、决策规则与策略 1.3.5 诱导过程、效用准则与马氏策略优势 1.4 马氏决策过程的起源和发展 第2章 有限阶段模型 2.1 最优准则 2.2 有限阶段的策略迭代和最优方程 2.3 最优策略的存在性和算法 2.4 最优策略的结构 2.5 单调策略的最优性 第3章 无限阶段折扣模型 3.1 最优准则 3.2 最优方程 3.3 最优策略的存在性 3.4 策略迭代算法 3.5 值迭代算法 3.6 改进的策略迭代算法 3.7 线性规划算法 3.8 最优单调策略 3.9 最优策略的结构 第4章 无限阶段平均模型 4.1 最优准则 4.2 最优平稳策略的存在性 4.3 平稳策略的一些特征 4.4 最优方程与策略迭代算法 4.5 单链的线性规划与相关问题 4.5.1 极限平均频率 4.5.2 带约束模型问题 4.5.3 方差问题 4.6 多链的线性规划与相关问题 4.6.1 对偶可行解与随机平稳策略 4.6.2 基本可行解与确定性 更多 |
商品评论(0条)