岗位职责:
1、参与深度学习相关算法的大模型性能加速落地;
2、参与深度学习大模型算法模型部署和优化工作;
岗位要求:
1、全日制硕士以上在校生,计算机、自动化、图像处理、模式识别等相关专业;
2、熟练掌握 C++、Python语言,有计算机体系结构背景,熟悉系统性能调优的方式;
3、具备基础的GPU编程能力,熟悉至少一种GPU加速库,如cublas、cudnn等;
4、有Tensorrt/OnnxRuntime/FasterTransformer等推理框架的实际开发经验;
5、熟悉各类深度学习网络和算子底层实现细节,推理模型调试、调优有实操经验;
6、熟悉GPU异构加速瓶颈分析方法,有服务器端 AI 芯片、GPU加速经验"