我们是一支聚焦"具身智能 + Agentic 系统"落地的算法团队,目标是让通用机器人在真实居家与工业场景中完成开放式任务。当前关注三条主线:
3D 语言场景图构建 (Scene Graph),让机器人理解 3D 世界
- 基于多视图 RGB-D / 点云 / 3DGS 等输入,构建可被 VLM 推理的 3D scene graph
- 探索语义 / 几何 / affordance 的统一表示与开放词汇 grounding
- 用 VLM/MLLM 做空间关系推理 (on / inside / reachable / behind...) ,为下游策略提供可解释的场景表征
- 实验主线:Habitat / Isaac Sim 中构建 benchmark + 真机验证
空间运动规划与场景内策略适配,让机器人在场景里完成精细任务
- 基于 scene graph / occupancy / BEV 做长时序导航与可达性规划
- 语言驱动的物体导航 (Object-Goal Navigation / VLN-CE) 与闭环 manipulation
- VLA / Diffusion Policy 在新场景的 few-shot 适配、residual policy、in-context fine-tuning
- 解决 "感知通了、执行差最后那 1cm" 的问题
高保真虚拟场景 + Agentic OS,通过高保真仿真加速能力迭代与验证
- 基于 Isaac Sim / Isaac Lab / Habitat / Gazebo 搭建可参数化的家居 / 工业场景
- 打通 ROS 2 Sim Real 全链路,支持本体在仿真里 24h 不间断运行评测
- 接入 LLM Agent (MCP 协议 / function calling / LangGraph) 做任务编排与自动 benchmark
- 协助沉淀团队 sim pipeline
---
基础要求
- 在读硕士或博士; CS / AI / 自动化 / 机械 等相关专业
- Python + PyTorch 扎实,能独立读懂顶会论文并复现
- 至少在以下技术栈里有一项跑通过的、可演示的经验:
- 3D 视觉:3DGS / NeRF / COLMAP / SLAM / 点云语义分割
- 仿真平台:Isaac Sim / Isaac Lab / Habitat / MuJoCo / Gazebo / SAPIEN
- 具身策略:ROS 2 / MoveIt / Diffusion Policy / ACT / OpenVLA / π 系列
- 大模型:VLM / VLA / SFT / DPO / GRPO / LangGraph / MCP / RAG
加分项
- 顶会 / 顶刊一作或共一:CVPR / ICCV / ECCV / ICRA / IROS / RA-L / T-RO / CoRL / NeurIPS / ICLR / ICML
- 在 Isaac Sim/Lab 或 Habitat 上跑通过端到端 Sim2Real 闭环
- 用 LeRobot / OpenVLA / π0/π0.5 / RDT / GR00T 等开源 VLA 框架做过真机部署
- 真机经验:Unitree / Franka / xArm / 松灵 PiPER / 灵巧手 / 移动底盘
- 在 MCP 协议、Apple VisionPro 遥操作、Talk2DINO、Gaussian Splatting 实时渲染上有 hands-on
- GitHub 有维护中的开源项目(代码 quality > star 数)
- 在校期间做个实际工程项目(比赛冠军、商业实习交付、开源项目核心贡献等)