岗位职责:
1. 参与Shopee大规模AI基础设施的设计与开发,支持包括大模型在内的各类AI业务场景;
2. 参与建设Shopee AI平台,打造覆盖数据处理、模型训练、微调和推理等全链路的端到端平台能力;
3. 参与大规模GPU算力集群的编排与调度系统开发与优化,提升集群的性能、稳定性及资源利用效率;
4. 跟进并落地前沿AI基础设施技术,包括新一代硬件架构、GPU优化方法和分布式系统设计,持续增强系统能力、降低资源成本。
岗位要求:
1. 2027届应届毕业生,计算机或相关专业,本科及以上学历;
2. 编程能力优秀,熟练掌握至少一门编程语言(如 Golang、C/C++、Python);
3. 熟悉 Linux 开发环境,具备扎实的算法与数据结构基础,良好的编程风格与系统设计能力;
4. 具备良好的学习能力、沟通协作能力和较强的自我驱动能力。
加分项:
1. 熟悉 Kubernetes、Kubeflow、Volcano、Ray 等开源系统,有实际使用或问题解决经验者优先;
2. 具备 AI 相关项目经验,如数据处理、模型训练或模型推理等;
3. 对 GPU、RDMA、NCCL 等底层计算与通信技术有一定了解。