【你将参与的方向】
具身智能 · 精细操作 · 模型研究(视觉/触觉/动作,多模态世界模型与策略学习)
你会直接参与打造下一代操作智能的关键能力:从数据与模型到策略与真机闭环,做能发论文、能上硬件、能产生影响力的工作。
【你会做什么】
- 世界模型 / 生成式预测
- 建模视觉-触觉-动作序列,学习可预测的状态表征与接触动力学
- 做未来预测与“想象式 roll-out”(latent dynamics / rollout)
- 策略学习与控制
- 基于世界模型进行 planning / policy learning(imitation / offline RL / RL / diffusion policy 等)
- 面向接触丰富任务的稳定控制与泛化(抓取、在手操作、插拔、旋拧、按压、拨动等)
- 数据与基准建设
- 设计与落地真实数据采集流程,构建训练数据与评测基准
- 推动可复现研究:实验框架、对照实验、ablation 与结果分析
- 真机闭环迭代
- 把模型跑到真实硬件上,持续迭代:sim2real、噪声、标定、延迟与鲁棒性等
【我们希望你具备】
- 27届及之后毕业在校生,可持续实习3个月及以上,每周至少 4 天投入,线下优先
- 熟练使用 PyTorch(或同等深度学习框架),具备良好实验与工程习惯(可复现、版本管理)
- 对以下任一方向有扎实基础(满足其一即可,越多越好):
- 多模态学习 / 生成模型(Transformer / diffusion / flow 等)
- 强化学习 / 模仿学习 / offline RL
- 机器人操作(manipulation)、接触动力学、控制
- 3D 视觉 / 位姿估计 / 点云等
- 加分项:
- 有机器人真机经验(ROS/ROS2、硬件调试、部署)
- 有相关论文/竞赛/开源项目(请附链接)
- 复现过经典工作(Diffusion Policy、RT 系列、world model、离线RL等)
【你能获得什么】
- 真机硬件与一线数据条件
- 各类先进的机械臂、灵巧手、遥操机构,以及触觉/多传感器数据采集系统
- 支持从数据到模型到真机的完整闭环
- 充足算力
- 支持高频实验与大模型训练/微调,让你把时间花在“做对”而不是“等机器”
- 顶级导师与环境
- 来自华为、机器人大厂、蔚来汽车智驾等领域专家指导
- 以及清华大学老师的研究指导与交流机会
- 充分自主性 + 论文支持
- 给你足够的研究空间与 ownership,支持发论文/技术报告/对外交流
- 鼓励做“有影响力的成果”,而不是一次性 demo