具身VLA大模型实习生
岗位职责:
1、进行多模态理解和生成大模型、机器人视觉-语言-动作模型所需的数据清洗、过滤和标注等工作;
2、进行真机数据采集、数据增强和数据合成方法,如使用仿真轨迹增广、模型预测想象等方法增强轨迹到多样性;
3. 进行多模态大模型到具身大模型到高效微调,动作空间对齐和后训练。
3、参与对机器人平台,例如宇树双灵巧手操作平台以及双臂操作平台进行调试和部署;
4、参与前沿的视觉-语言-动作模型如OpenVLA、RDT、OpenPi0等进行研究。
任职要求:
1、实习时间至少6个月,每周保证5天出勤;
2、硕士及以上学历在读,要求计算机科学、自动化等相关专业,有以下一项或多项内容的研究经验:基础模型训练或者微调,机器人策略真机部署,机器人策略学习,世界模型训练,自动化或遥操数据采集,Real-to-Sim映射,数据增广;
3、有实际的机器人开发经验优先,有大规模数据生成与处理经验优先;
4、熟悉三维坐标变换,计算机视觉基础知识,了解机器人运动学,需对VLA领域内有较为广泛的文献熟悉了解,且有较好的Robotic Policy算法复现能力,包括但不限于Diffusion Policy、OpenVLA等;
5、具备优秀的工程能力,有相关项目开发经验者优先;
6、具备良好的团队合作精神和沟通能力,能够独立思考和解决问题。