基于Python的强化学习

| 中国电力出版社

ISBN:9787519870379

原价: ￥88.00

销售价:￥17.40元

参与书籍回收后，可享更低价格

本书首先介绍在强化学习环境中工作所需的工具、库和设置，涵盖了强化学习的构成模块，深入探讨基于值的方法，如Q-learning和SARSA算法的应用。读者将学习如何结合使用Q-learning和神经网络来解决复杂问题。此外，在学习*d*dPG和TD3确定性算法之前，读者将学习策略梯度方法，如TRPO和PPO，以提高性能和稳定性。本书还介绍模仿学习的原理，以及Dagger如何教智能体飞行。读者将探索进化策略和黑盒优化技术。最后，读者将掌握探索方法，如UCB和UCB1，并开发一个名为ESBAS的元算法。

更多低价好书购买/书籍回收

扫码访问微信小程序

在线客服

了解更低购买价格、或有疑问需要帮助，可以找小鲸鱼噢~

咨询在线客服