AI工具链开发实习生 /AI Toolchain Development Intern
2026-03-13 10:00:50 刷新
150-300/天 深圳 硕士 3天/周 实习3个月 提供转正机会
一对一导师实习津贴节日福利
微信扫码同步查看
投递方便通知及时
扫码手机查看
投个简历
职位描述:
【岗位背景】 在AI芯片与大模型爆发的时代,工具链是连接算法生态与硬件算力的核心桥梁。我们需要具备C++/Python双栈能力的复合型人才,参与构建从模型导入、图优化、算子生成、量化压缩到推理部署的全流程工具链。 您将不再局限于单一模块,而是深入工业级AI系统的全貌:用C++挑战性能极限,用Python构建自动化生态,用编译优化与量化技术释放硬件潜能。 【岗位职责】 作为工具链开发实习生,您将深度参与以下核心工作流: 全流程工具链开发与维护: ·参与AI编译器前端(模型解析/图优化)或后端(代码生成/指令调度)模块的开发,支持PyTorch/TensorFlow模型到自研芯片的高效映射。 ·基于C++实现高性能神经网络算子(如Conv, MatMul, Attention, LayerNorm等),并利用Python构建算子的自动化验证与回归测试框架。 模型转换与一致性保障: ·负责ONNX及主流框架模型的解析、转换与优化,确保模型在转换前后的数值精度一致性(FP32/FP16/INT8)。 ·编写Python脚本构建大规模模型测试集,覆盖功能正确性、边界场景及异常处理,快速定位并修复转换过程中的Bug。 性能优化与量化落地: ·协助进行算子级的性能剖析(Profiling),利用循环展开、分块(Tiling)、向量化等技术优化关键路径。 ·参与模型量化(Quantization)工具的开发,支持PTQ(训练后量化)与QAT(感知训练量化),实现INT8/FP8精度的高效推理。 编译优化技术探索: ·参与基于MLIR/TVM/LLVM的编译优化Pass开发,实现算子融合、内存复用及并行调度策略。 探索大模型(LLM)特有的优化技术(如FlashAttention算子集成、显存优化、动态Shape支持)。 文档与生态建设: ·撰写高质量的技术文档、API说明及最佳实践指南,协助构建友好的开发者生态。 【任职要求】 (我们需要您同时具备扎实的C++功底与灵活的Python能力) 1.学历专业: 计算机、电子工程、自动化、数学或相关专业在读硕士/博士研究生。 2.编程语言(双栈核心): 精通 C++:扎实的编程基础,熟悉指针、内存管理、多线程、模板编程,掌握现代C++特性(C++11/14/17/20)。 熟练 Python:能熟练使用Python进行脚本开发、数据处理及自动化测试,熟悉 NumPy, pytest, pandas 等库。 3.AI与系统基础: 深入理解常见神经网络结构(CNN, Transformer, MoE等)及其数学原理,熟悉基础算子(Conv, GEMM, Softmax等)的计算逻辑。 熟悉 Linux 开发环境,精通 Git 版本控制工作流。 4.框架与工具: 有 PyTorch 或 TensorFlow 的实际使用经验,了解模型训练与推理流程。 了解 ONNX 标准、模型转换流程或主流推理框架(ONNX Runtime, TFLite, TensorRT)者优先。 5.综合素质: 具备极强的问题分析与调试能力(Debug),善于利用日志、断点及性能分析工具定位复杂问题。 责任心强,拥有良好的团队协作精神与沟通表达能力。 【加分项】(具备以下任一条件将极大增加录用概率及定级) 编译优化专家:熟悉 LLVM, MLIR, TVM, XLA 等编译框架,有自定义Pass开发或Codegen经验者优先。 量化技术达人:深入理解模型量化原理(对称/非对称量化、校准算法、伪量化),有实际量化项目落地经验。 高性能计算:了解CPU/GPU/NPU体系结构,有 CUDA, SIMD (AVX/NEON) 编程或汇编优化经验。 开源贡献者:在 GitHub 上有高质量开源项目,或是 TVM, PyTorch, ONNX, MLIR 等社区的 Contributor。 学术/竞赛成果:在顶级会议(MLSys, CGO, CVPR等)发表过系统相关论文,或在ACM/ICPC、AI芯片大赛中获奖。 【转正机会】: 表现优异者可直接获得全职Offer(SP/SSP级别)
投递要求:
简历要求: 中文 英文
截止日期:2026-04-12
工作地点:
广东省/深圳市/福田区 深圳市九天睿芯科技有限公司
求职中若出现虚假宣传,收取财物等违法情况。请立即举报
投个简历
公司简介