助理教授(拟入职)
AI经济学,生成模型经济学,多智能体,强化学习
教育背景2025年,获得哈佛大学计算机科学博士学位,师从David C. Parkes教授、Milind Tambe教授。
2021年,获得清华大学交叉信息研究院计算机科学硕士学位。
研究方向未来世界是一个人类和AI智能体共生的世界。我希望研究解决向这个世界转变过程中会出现的人与AI之间的关系问题,包括新的AI经济形态,新型关系是否可被证明安全,以及其中涉及的AI决策学习问题。
正在研究的问题包括:
1. 生成式广告
2. Human-AI博弈
3. 可证明的微观经济学问题的深度学习求解
4. 强化学习,尤其是具身智能体的肌群协同控制
代表性工作介绍1. AI + economics: 使用深度学习方法解决了经济学中最基础、最重要的开放性问题之一: 严格激励相容(DSIC)的拍卖理论。相关奠基性贡献屡获诺贝尔奖。本文为国际首次提出的、严格保证DSIC的、适用多对象多参与者的机制设计方案。
2. Modular RL: 从多智能体角度解决机器人控制中的一个基本问题:如何实现多关节机器人高效控制策略的有效学习。研究将每个机器人关节视作一个智能体,提出学习多个关节共享一个元控制信号的低秩控制策略,在具身智能中实现了人类的肌群协同机制。
3. Role-Based Multi-Agent RL: 利用深度学习方法学习智能体之间的分工,解决多智能体的大规模合作问题。提出的算法学习任务分解,每个智能体学习承担一个角色来解决其中一个子任务,同一智能体在不同时刻可以承担不同角色,承担同一角色的智能体共享一个深度策略网络以及经验数据,以此来降低学习难度并提高学习效率。