工作职责:
1.协助面向国内外多种GPU进行高性能算子开发与优化
2.协助面向在不同GPU间移植高性能算子的需求,参与编译技术开发
任职要求:
1. 计算机科学或相关领域硕士研究生及以上学历,能够尽快到岗
2. 熟悉 Python、C++、C 等编程语言
3. 具备编译优化经验或 GPU 等加速卡的算子优化经验
4. 熟悉深度学习、熟悉 PyTorch 等深度学习框架者优先
5. 具备矩阵乘、flash attention 等计算密集型算子优化经验者优先
6. 熟悉 Triton、TVM、MLIR 等深度学习专用编译器或编译器组件等的优先
7. 有良好的沟通和协调能力,具备团队合作精神,能够承受工作压力,对技术有强烈的热情和求知欲