作品简介
本书从强化学习的基础知识出发,结合PyTorch深度学习框架,介绍深度强化学习算法各种模型的相关算法原理和基于PyTorch的代码实现。作为一本介绍深度强化学习知识的相关图书,本书介绍了常用的强化学习环境,基于价值网络的强化学习算法和基于策略梯度的强化学习算法,以及一些常用的比较流行的深度强化学习算法(如蒙特卡洛树搜索)等。另外,还介绍了深度强化学习算法在实际问题中的一些应用。
作为一本深度强化学习的入门书籍,本书主要面向有深度学习和Python基础,并且希望对深度强化学习有所了解的读者。读者不仅可以从本书中获取深度强化学习有关的理论知识,还可以得到深度强化学习领域的实践知识。
张校捷,Shopee资深机器学习工程师,负责推荐系统的算法实现和优化。目前主要使用的技术栈是深度学习框架后端的C/C++/CUDA,以及深度学习框架前端的Python。熟悉主流的深度学习框架,如PyTorch和TensorFlow,同时熟悉计算机视觉、自然语言处理和推荐系统方面的深度学习算法。
作者曾多次作为专题演讲嘉宾,受邀参加Google、PyCon和CSDN主办的技术大会。
