【AMS讲堂第十期】熵正则化强化学习系统中的线性-二次Stackelberg微分博弈

发布者:数学学院发布时间:2025-07-29浏览次数:10

报告题目:熵正则化强化学习系统中的线性-二次Stackelberg微分博弈

报告人:徐林

报告时间:202586日星期三 10:00-11:00

地点:腾讯会议 758654038

 

报告摘要:本文提出了一个新颖的理论框架,用于研究熵正则化的强化学习线性-二次型Stackelberg微分博弈问题。系统的动态行为由布朗运动驱动的随机微分方程刻画,博弈参与者的策略由状态依赖的概率分布表示。本文借助动态规划原理,推导出该博弈值函数所满足的Hamilton-Jacobi-Bellman-Isaacs方程。在此基础上,进一步获得了博弈中领导者与跟随者之间相互耦合的最优分布策略,并基于此设计了一种策略改进算法来近似求解值函数。为验证该方法的有效性与鲁棒性,我们进行了数值实验,展示了所提出强化学习框架的实际表现。此外,我们还研究了随机跳跃扰动对值函数与最优策略的影响,从博弈论角度揭示了二者之间的内在联系。

 

个人简介:徐林,安徽师范大学数学与统计学院教授,博士生导师。主要研究方向为随机控制及其在金融保险中的应用研究,发表科研论文40余篇,主持国家自然科学基金项目3项,教育部人文社科项目2项,安徽师自然科学基金项目1项。