【RLChina论文研讨会】第24期 王远非 Multi-Agent Communication and Cooperation with Theory of
【RLChina论文研讨会】第19期 袁雷 Multi-Agent Incentive Communication via Decentralized Team
【RLChina论文研讨会】第53期 曾兰婷 基于强化学习控制的低碳电力系统安全性研究
【RLChina论文研讨会】第31期 姜力 一种模仿结合策略引导的离线强化学习算法
【RLChina 2021】第7课 强化学习进阶(一) 杨卓然
【RLChina论文研讨会】第34期 李姝昕 基于预训练的策略求解大规模追击博弈
【RLChina论文研讨会】第15期 陈睿卿 Multi-Agent Trust Region Policy Optimization Algorithm
【RLChina论文研讨会】第13期 李斯源 Active Hierarchical Exploration with Stable Subgoal Rep-L
【RLChina论文研讨会】第80期 冯加恒 离线到在线强化学习中的稳定化无约束微调
【RLChina 2022】前沿进展二:强化学习在金融决策里的应用 徐任远
【RLChina论文研讨会】第43期 阳明宇 多智能体强化学习中的动态子任务分配
【RLChina论文研讨会】第81期 曲云 基于反事实保守Q学习的离线多智能体强化学习算法
【RLChina 2021】第12课 多智能体入门(二) 杜雅丽
【RLChina论文研讨会】第19期 潘玲 Softmax Regularized Deep Multi-Agent Q-Learning
【RLChina论文研讨会】第78期 胡紫灿 多智能体强化学习中基于注意力的对比角色表征
【RLChina 2023】 专题报告三:强化学习与语言大模型的一些共通点 俞扬
【RLChina论文研讨会】第31期 牛浩懿 何时相信你的仿真器:考虑动力学偏差的混合离线在线强化学习
【RLChina论文研讨会】第22期 尤恒 基于状态和动作对应关系的跨域自适应迁移强化学习
【RLChina论文研讨会】第11期 王治海 Sample-Efficient RL via Conservative M-b Actor-Critic
【RLChina论文研讨会】第70期 吴梓帆 优化基于模型多智能体强化学习中的多步局部模型交互