
本书虑大规模且具有挑战的多阶段决策问题。原则上,此类问题可以通过动态规划来求解。但是,对于许多实际问题,以该方法进行数值求解是难以实现的。本书探讨的求解方法通过采用相关的近似,能够给出满足能要求的次优策略。此类方法被统称为强化学。强化学从很优控制和人工智能这两个领域的思想碰撞中获益良多。本书的目的之一便是探讨这两个领域的共同边界,从而为具有其中任一领域背景的研究者提供通向另一领域的桥梁。另外一个目的则是挑选出许多在实践中证明有效的且具有坚实的理论与逻辑基础的方法,并将它们有组织地整理起来。原著作者美国工程院院士dimitrip.berteka教授,有极高的学术造诣和学术声誉,在学术专著和教材的写作方面取得了公认的。
阅读更多