序
人工智能已经成为具有国家战略意义的关键技术之一,对科技、产业和社会变革产生了巨大的推动力,在智能制造、智慧医疗、智慧环保、智慧城市、智能农业、国防建设等各个领域得到了广泛的应用。与此同时,新一代人工智能相关的理论和方法研究也取得了显著的进展。强化学习是人工智能领域的一个重要分支,使得智能体能够在与环境的交互中学习并优化策略,进而促进自主智能系统的发展。随着理论研究的深化和计算能力的提升,强化学习在自动控制领域得到了广泛的关注,为解决复杂的实时决策和控制问题提供了新思路。近年来,强化学习在自动驾驶、智能机器人、工业自动化等领域的应用不断扩展,各种强化学习算法常被用于解决不同类型的控制问题,从而实现智能自适应的决策和控制系统设计,更好地应对实际中的复杂特性。特别地,深度强化学习通过从大量数据和交互中学习,为求解复杂动态系统的优化控制问题提供了新理念。智能控制与强化学习涉及计算机科学、控制理论、机器学习等多个学科领域,两者的相互发展可以推动技术创新,促进系统性能提升。这不仅有助于改进已有的技术,还可以催生出颠覆性新技术,为科技进步和社会发展带来新的动力,推动人类社会向着可持续、更加智能化的方向发展。
本书作者多年来以不确定环境下的自适应评判设计相关理论与技术为出发点,紧跟学术界和工业界热点,开展一系列具有前沿性和开拓性的研究工作,致力于推进新一代人工智能技术应用于复杂动态系统智能控制与优化。融合强化学习和数据驱动等领域的先进技术,面向演化学习机制和快速决策需求,建立一套值迭代评判学习控制理论与设计方法,总结并完善近年来基于评判学习机制的各种先进值迭代技术,为包含城市污水处理在内复杂工业系统智能控制与优化提供一定的支撑。同时,本书理论分析和仿真实验并重,可为相关领域人员开展新一代人工智能基础理论和关键技术研究提供帮助,也可作为同类方向教学和科研的参考书。
刘德荣
南方科技大学讲席教授、博士生导师
IEEE Fellow、INNS Fellow、IAPR Fellow、欧洲科学院院士