助理教授(拟入职)
以人为中心的具身智能、人机协作、数字人、计算机视觉、图形学、机器人、机器学习
教育/工作背景2019年9月–2024年10月: 苏黎世联邦理工学院(ETH Zürich)与马克斯·普朗克智能系统研究所(MPI for Intelligent Systems)导师:Michael J. Black、Marc Pollefeys
2023年10月–2024年11月: Meshcapade (Acquired by Epic Games) 研究科学家
2025年1月-: 美国斯坦福大学计算机科学系博士后研究员(合作导师:Karen Liu、Scott Delp)
研究方向研究聚焦以人为中心的具身智能(Human-Centric Embodied Intelligence)——构建真正理解人类行为、建模人与世界交互、并与人协作的通用具身大脑。三个核心方向:
Human-Centric Perception(人感知) —— 从视频与多模态信号中理解人的动作、意图与行为,以及人与物体、人与场景、人与人之间的交互关系,构建对真实世界中人类行为的细粒度理解。
Human-Centric Understanding(人理解) —— 将大语言模型与三维人体表达深度融合,让机器能够用语言推理、描述、编辑人的姿态、动作、外观与行为,统一身体、手部、服装、交互等多种人体表征的语言级理解,搭建从 LLM 到具身大脑之间的关键桥梁。
Human-Centric Embodiment(人具身) —— 面向家庭、长照与服务场景,研究视频世界模型与人机协同动作策略,让一个智能体跨越数字人、虚拟角色与物理机器人的边界,真正在与人共处的环境中行动。
代表性工作介绍在博士早中期,研究重点集中于数字人三维表达与多模态人体重建方向,以第一作者身份发表了一系列具有影响力的工作,包括 DECA、PIXIE、SCARF 等,建立了从面部到全身、从单图到视频的人体表达基础模型体系。在博士后期与 Meshcapade 期间,研究方向进一步拓展至大语言模型与数字人的融合,提出了 ChatPose、ChatHuman 等代表性工作,将语言模型与三维人体行为表达直接连接。进入博士后阶段后,研究重心转向以人为中心的具身智能与人机协作,以核心参与者身份提出 GentleHumanoid 等工作,研究人形机器人在与人共处场景中的安全、柔顺物理交互行为。截至目前,已在计算机图形学(SIGGRAPH / SIGGRAPH Asia)、计算机视觉(CVPR / ICCV / ECCV)、机器学习(ICLR / NeurIPS)、机器人(Science Advances) 等领域的顶级国际会议和期刊上累计发表论文 20 余篇,Google Scholar 引用 3000+ 次,主导的论文和开源项目在 GitHub 上累计获得约15000星标。获得 MIT EECS Rising Stars、WiGRAPH Rising Stars in Computer Graphics、Eurographics PhD Award Candidate 等荣誉。