【岗位背景】
在AI芯片与大模型爆发的时代,工具链是连接算法生态与硬件算力的核心桥梁。我们需要具备C++/Python双栈能力的复合型人才,参与构建从模型导入、图优化、算子生成、量化压缩到推理部署的全流程工具链。
您将不再局限于单一模块,而是深入工业级AI系统的全貌:用C++挑战性能极限,用Python构建自动化生态,用编译优化与量化技术释放硬件潜能。
【岗位职责】
作为工具链开发实习生,您将深度参与以下核心工作流:
全流程工具链开发与维护:
·参与AI编译器前端(模型解析/图优化)或后端(代码生成/指令调度)模块的开发,支持PyTorch/TensorFlow模型到自研芯片的高效映射。
·基于C++实现高性能神经网络算子(如Conv, MatMul, Attention, LayerNorm等),并利用Python构建算子的自动化验证与回归测试框架。
模型转换与一致性保障:
·负责ONNX及主流框架模型的解析、转换与优化,确保模型在转换前后的数值精度一致性(FP32/FP16/INT8)。
·编写Python脚本构建大规模模型测试集,覆盖功能正确性、边界场景及异常处理,快速定位并修复转换过程中的Bug。
性能优化与量化落地:
·协助进行算子级的性能剖析(Profiling),利用循环展开、分块(Tiling)、向量化等技术优化关键路径。
·参与模型量化(Quantization)工具的开发,支持PTQ(训练后量化)与QAT(感知训练量化),实现INT8/FP8精度的高效推理。
编译优化技术探索:
·参与基于MLIR/TVM/LLVM的编译优化Pass开发,实现算子融合、内存复用及并行调度策略。
探索大模型(LLM)特有的优化技术(如FlashAttention算子集成、显存优化、动态Shape支持)。
文档与生态建设:
·撰写高质量的技术文档、API说明及最佳实践指南,协助构建友好的开发者生态。
【任职要求】
(我们需要您同时具备扎实的C++功底与灵活的Python能力)
1.学历专业:
计算机、电子工程、自动化、数学或相关专业在读硕士/博士研究生。
2.编程语言(双栈核心):
精通 C++:扎实的编程基础,熟悉指针、内存管理、多线程、模板编程,掌握现代C++特性(C++11/14/17/20)。
熟练 Python:能熟练使用Python进行脚本开发、数据处理及自动化测试,熟悉 NumPy, pytest, pandas 等库。
3.AI与系统基础:
深入理解常见神经网络结构(CNN, Transformer, MoE等)及其数学原理,熟悉基础算子(Conv, GEMM, Softmax等)的计算逻辑。
熟悉 Linux 开发环境,精通 Git 版本控制工作流。
4.框架与工具:
有 PyTorch 或 TensorFlow 的实际使用经验,了解模型训练与推理流程。
了解 ONNX 标准、模型转换流程或主流推理框架(ONNX Runtime, TFLite, TensorRT)者优先。
5.综合素质:
具备极强的问题分析与调试能力(Debug),善于利用日志、断点及性能分析工具定位复杂问题。
责任心强,拥有良好的团队协作精神与沟通表达能力。
【加分项】(具备以下任一条件将极大增加录用概率及定级)
编译优化专家:熟悉 LLVM, MLIR, TVM, XLA 等编译框架,有自定义Pass开发或Codegen经验者优先。
量化技术达人:深入理解模型量化原理(对称/非对称量化、校准算法、伪量化),有实际量化项目落地经验。
高性能计算:了解CPU/GPU/NPU体系结构,有 CUDA, SIMD (AVX/NEON) 编程或汇编优化经验。
开源贡献者:在 GitHub 上有高质量开源项目,或是 TVM, PyTorch, ONNX, MLIR 等社区的 Contributor。
学术/竞赛成果:在顶级会议(MLSys, CGO, CVPR等)发表过系统相关论文,或在ACM/ICPC、AI芯片大赛中获奖。
【转正机会】: 表现优异者可直接获得全职Offer(SP/SSP级别)