本岗位为清华大学孵化企业求之科技(无锡)有限公司实习岗位,可base北京/无锡。
【岗位职责】
1、复现前沿的VLA/VLM模型,并在仿真器与实际机器人平台上进行部署、调试与测试;
2、参与构建和维护模型复现、训练与部署的代码仓库 (如 GitHub/GitLab),确保代码清晰、可复现、文档完善;
3、撰写详细的技术文档、实验报告和代码说明 (如 README, Wiki),清晰记录模型性能、部署步骤、问题及解决方案;
4、协助工程师参与机器人数据的整理、标注、清洗及测试集构建工作;
5、参与轻量级工具或脚本的开发,提升模型部署或测试的效率。
【任职要求】
1、研究生及以上学历,人工智能、自动化、电子工程、计算机等相关专业优先;
2、熟悉深度学习原理,了解常用神经网络的网络结构、训练范式、测试指标;
3、熟悉常用深度学习框架(如 PyTorch、JAX等),有丰富网络训练调优的项目经验;
4、下列项目经验有其一:
a) 具备较强的模型复现能力,能够根据论文和开源代码实现模型训练与推理流程;
b) 了解具身智能与计算机视觉领域的前沿算法(如Diffusion Policy,Pi0,Gaussian Splatting等);
c) 熟悉三维计算机视觉,了解3D Vision 领域常用模型(如PointNet,SparseConv等);
5、熟练掌握 Python 编程语言,具备独立定位并解决算法与软件问题的能力;
6、关注行业前沿,对具身智能发展有浓厚兴趣;
7、具备一定英文基础,能看懂英文技术文档;
8、熟练使用 Git 开发协作工具。
【加分项】
1、在机器学习领域 / 计算机视觉领域 的国际顶级期刊 / 会议发表过论文;
2、有在 Linux 环境下成功复现、部署并测试 VLA/VLM 或其他深度学习模型到实际硬件平台(如机器人、嵌入式设备)的项目经验;
3、了解 ROS/ROS2 机器人操作系统;
4、了解 CUDA 并行计算,有 GPU 加速程序的基础经验;
5、有维护个人或参与维护开源项目代码仓库的经验,代码风格良好,文档清晰。在 GitHub 等平台上有高质量的技术博客、项目文档或开源代码贡献;
6、了解模型裁剪、量化原理,有边缘部署的项目经验。