【岗位职责】
1. 优化 VLA 与其他具身算法的推理效率,提升算法推理的响应速度与吞吐量,并适配具体硬件平台;
2. 优化 VLA 与其他具身算法的数据利用效率与训练速度;
3. 基于模型蒸馏、模型量化等方案,使得算法在满足边缘硬件平台的算力约束下,基本维持算法推理性能;
4. 基于现有工具链,在机器人系统中集成感知决策算法,在开放、动态的环境下实现机器人的自主智能。
【任职要求】
1. 研究生及以上学历,计算机、软件工程、人工智能等专业优先;
2. 熟练掌握计算机系统原理,对 CPU 密集与 IO 密集型任务均有丰富的性能优化思路;
3. 熟练掌握深度学习原理,了解常用神经网络的网络结构、训练范式、测试指标;
4. 熟练掌握深度学习模型的推理优化原理,熟练掌握模型蒸馏、模型量化、模型剪载等模型优化方案;
5. 下列项目经验至少有其一:
a. 在现代神经网络架构上,使用 FlashAttention、KV Cache 等方式进行推理优化;
b. 有在量产产品上基于瑞芯微、地平线等硬件平台部署深度学习模型的实战经历;
c. 了解 CUDA 并行计算框架,在实际项目中有 CUDA 实现经历。
6. 具备较强英语能力,能高效阅读英文论文与技术文档;
7. 能够熟练使用 AI 工具,提升编程实现与调试效率;
8. 在过往项目中熟练使用 git 版本管理工具。