冯瑶-清华大学人工智能学院

人员队伍

冯瑶

助理教授（拟入职）

以人为中心的具身智能、人机协作、数字人、计算机视觉、图形学、机器人、机器学习

教育/工作背景

2019年9月–2024年10月： 苏黎世联邦理工学院（ETH Zürich）与马克斯·普朗克智能系统研究所（MPI for Intelligent Systems）导师：Michael J. Black、Marc Pollefeys

2023年10月–2024年11月： Meshcapade (Acquired by Epic Games) 研究科学家

2025年1月-： 美国斯坦福大学计算机科学系博士后研究员（合作导师：Karen Liu、Scott Delp）

研究方向

研究聚焦以人为中心的具身智能(Human-Centric Embodied Intelligence)——构建真正理解人类行为、建模人与世界交互、并与人协作的通用具身大脑。三个核心方向:

Human-Centric Perception(人感知) —— 从视频与多模态信号中理解人的动作、意图与行为,以及人与物体、人与场景、人与人之间的交互关系,构建对真实世界中人类行为的细粒度理解。
Human-Centric Understanding(人理解) —— 将大语言模型与三维人体表达深度融合,让机器能够用语言推理、描述、编辑人的姿态、动作、外观与行为,统一身体、手部、服装、交互等多种人体表征的语言级理解,搭建从 LLM 到具身大脑之间的关键桥梁。
Human-Centric Embodiment(人具身) —— 面向家庭、长照与服务场景,研究视频世界模型与人机协同动作策略,让一个智能体跨越数字人、虚拟角色与物理机器人的边界,真正在与人共处的环境中行动。

代表性工作介绍

在博士早中期，研究重点集中于数字人三维表达与多模态人体重建方向，以第一作者身份发表了一系列具有影响力的工作，包括 DECA、PIXIE、SCARF 等，建立了从面部到全身、从单图到视频的人体表达基础模型体系。在博士后期与 Meshcapade 期间，研究方向进一步拓展至大语言模型与数字人的融合，提出了 ChatPose、ChatHuman 等代表性工作，将语言模型与三维人体行为表达直接连接。进入博士后阶段后，研究重心转向以人为中心的具身智能与人机协作，以核心参与者身份提出 GentleHumanoid 等工作，研究人形机器人在与人共处场景中的安全、柔顺物理交互行为。截至目前，已在计算机图形学（SIGGRAPH / SIGGRAPH Asia）、计算机视觉（CVPR / ICCV / ECCV）、机器学习（ICLR / NeurIPS)、机器人(Science Advances) 等领域的顶级国际会议和期刊上累计发表论文 20 余篇，Google Scholar 引用 3000+ 次，主导的论文和开源项目在 GitHub 上累计获得约15000星标。获得 MIT EECS Rising Stars、WiGRAPH Rising Stars in Computer Graphics、Eurographics PhD Award Candidate 等荣誉。

详情请参考：https://yfeng95.github.io

人员队伍

冯瑶

教育/工作背景

研究方向

代表性工作介绍

Email

yaofeng@stanford.edu

Office

中关村智造大街F座3层

Homepage

https://yfeng95.github.io/