1、参与多模态大语言模型基础设施的核心开发工作,涵盖模型训练等关键环节的架构优化与性能提升,探索和实践训练性能提升和训练范式迭代等方面的核心技术;
2、协助进行大模型训练集群的管理与调优,解决分布式训练过程中出现的资源调度、通信效率等问题,提升训练吞吐量与稳定性;
3、跟进大模型Infra领域的前沿技术动态,将新技术、新方法融入到现有系统中,推动技术栈的持续演进;
4、与算法团队紧密协作,将算法研究成果高效落地,为大模型的迭代升级提供坚实的基础设施支撑。1、硕士及以上学历在读,计算机科学与技术、软件工程、电子工程等相关专业优先;
2、具备扎实的编程基础,有良好的代码规范与调试能力,能够使用Codex等代码工具提升开发效率;
3、自驱力强,对大模型Infra领域充满热情,能够主动学习并解决复杂技术问题;
4、拥有编程竞赛背景者优先,如在ACM-ICPC、CCPC等竞赛中获得奖项,具备较强的算法思维与问题解决能力;
5、有大模型Infra开发相关经验者优先,熟悉分布式训练框架(如PyTorch Distributed、TensorFlow Distributed等);
6、具备良好的沟通协作能力,能够在跨团队合作中高效推进工作。
你将获得:
1、深度参与大模型核心基础设施建设的机会,接触行业前沿技术,快速提升技术能力;
2、与资深算法专家合作,探索前沿算法和模型技术,助力个人职业成长;
3、灵活的工作时间与轻松的工作氛围,丰富的团队建设活动与学习交流机会;
4、具有竞争力的实习薪资与丰厚的实习福利。