| 随机学习与优化在现代工程、社会、金融问题中具有广泛的应用。本书以一个统一的框架,涵盖了离散事件动态系统的摄动分析、马尔可大决策过程、强化学习、辨识和自适应控制等学习和优化的不同学科;并利用基于性能差分公式的简单方法介绍马尔可夫决策过程理论,通过该方法能求得以长期平均代价为准则的n阶偏差优化策略以及无折扣的blackwell优化策略。本书还包含有最近发展出来的基于事件的优化方法,它为利用系统的特性来克服或减轻维数灾的研究开辟了个新方向。本书强调以样本路径的构造为基础的物?解释,物理上的直观认识可以为完善已有的优化方法提供新思路。 为帮助读者理解掌握书中的内容,本书提供了大量的示例和丰富的习题。 本书适合作为相关专业的研究生教材,学生可从一门课程中学到原本属于多个不同学科的内容。本书有助于促进学习和优化领域中各学科之间的合作,对该领域的研究人员也大有裨益。 |
商品评论(0条)