职位职责:
1. 负责高性能系统的性能分析及优化,服务于AI训练和推理系统,能迅速定位性能问题,并设计出有效的软件加速方案;
2. 结合实际业务需求,开展软硬件协同优化和技术创新(包括高性能网络通信、高性能数据存储/加载加速,算子优化与编译,分布式推理优化等)工程实现,为实际业务提供极致的高性能;
3. 探索使用新的高性能软硬件技术(包括异构加速服务器、DPU等硬件加速器,用户态传输协议/io_uring异步IO框架/eBPF等)以持续提升系统服务性能。
职位要求:
1. 精通Linux环境下的C/C++/Python编程;
2. 熟悉计算机体系架构,如Intel/AMD CPU和I/O子系统架构、PCIE协议,以及计算机存储/网络I/O软件栈等,具有系统性能分析及优化经验者优先;
3. 若具有以下任何一种开发经验者优先:RDMA网络编程,CUDA编程,分布式存储,数据缓存系统,HPC系统;
4. 若具有主流深度学习框架(如PyTorch、TensorFlow等)相关开发经验者优先;
5. 具有强烈的责任心,优秀的学习能力、沟通能力和自驱力。