【AMS讲堂第十期】熵正则化强化学习系统中的线性-二次Stackelberg微分博弈

发布者：数学学院发布时间：2025-07-29浏览次数：145

报告题目：熵正则化强化学习系统中的线性-二次Stackelberg微分博弈

报告人：徐林

报告时间：2025年8月6日星期三 10:00-11:00

地点：腾讯会议 758654038

报告摘要：本文提出了一个新颖的理论框架，用于研究熵正则化的强化学习线性-二次型Stackelberg微分博弈问题。系统的动态行为由布朗运动驱动的随机微分方程刻画，博弈参与者的策略由状态依赖的概率分布表示。本文借助动态规划原理，推导出该博弈值函数所满足的Hamilton-Jacobi-Bellman-Isaacs方程。在此基础上，进一步获得了博弈中领导者与跟随者之间相互耦合的最优分布策略，并基于此设计了一种策略改进算法来近似求解值函数。为验证该方法的有效性与鲁棒性，我们进行了数值实验，展示了所提出强化学习框架的实际表现。此外，我们还研究了随机跳跃扰动对值函数与最优策略的影响，从博弈论角度揭示了二者之间的内在联系。

个人简介：徐林，安徽师范大学数学与统计学院教授，博士生导师。主要研究方向为随机控制及其在金融保险中的应用研究，发表科研论文40余篇，主持国家自然科学基金项目3项，教育部人文社科项目2项，安徽师自然科学基金项目1项。