职责描述:
1、深度参与LLM系统优化,协助团队达成效果目标;
2、负责面向LLM的分布式训练优化和推理引擎优化。
任职要求:
1、计算机或相关专业各高校在读优秀硕士生、博士生;
2、优秀的编程能力,掌握C/C++,Python编程语言,扎实的数据结构和算法知识;
3、计算机基础知识扎实,熟练掌握计算机体系架构、并行计算知识;
4、具备DeepSpeed,Megatron等分布式训练框架开发优化经验者优先;
5、具备TVM、TensorRT、FasterTransformer等推理框架,推理集群开发优化经验者优先;
6、熟悉CUDA或者其他AI芯片体系结构,并基于这些芯片有算子开发优化经验者优先。