仅支持付费会员使用

本书从强化学习最基本的概念开始介绍,将介绍基础的分析工具,包括贝尔曼公式和贝尔曼最优公式,然后推广到基于模型的和无模型的强化学习算法,最后推广到基于函数逼近的强化学法。本书强调从数学的角度引入概念、分析问题、分析算法,并不强调算法的编程实现。本书不要求读者具备任何关于强化学习的知识背景,仅要求读者具备一定的概率论和线性代数的知识。如果读者已经具备强化学习的学习基础,本书可以帮助读者更深入地理解一些问题并提供新的视角。 本书面向对强化学习感兴趣的本科生、研究生、研究人员和企业或研究所的从业者。
本书从强化学习最基本的概念开始介绍,将介绍基础的分析工具,包括贝尔曼公式和贝尔曼最优公式,然后推广到基于模型的和无模型的强化学习算法,最后推广到基于函数逼近的强化学法。本书强调从数学的角度引入概念、分析问题、分析算法,并不强调算法的编程实现。本书不要求读者具备任何关于强化学习的知识背景,仅要求读者具备一定的概率论和线性代数的知识。如果读者已经具备强化学习的学习基础,本书可以帮助读者更深入地理解一些问题并提供新的视角。 本书面向对强化学习感兴趣的本科生、研究生、研究人员和企业或研究所的从业者。
本书从强化学习最基本的概念开始介绍,将介绍基础的分析工具,包括贝尔曼公式和贝尔曼最优公式,然后推广到基于模型的和无模型的强化学习算法,最后推广到基于函数逼近的强化学法。本书强调从数学的角度引入概念、分析问题、分析算法,并不强调算法的编程实现。本书不要求读者具备任何关于强化学习的知识背景,仅要求读者具备一定的概率论和线性代数的知识。如果读者已经具备强化学习的学习基础,本书可以帮助读者更深入地理解一些问题并提供新的视角。 本书面向对强化学习感兴趣的本科生、研究生、研究人员和企业或研究所的从业者。

