职责描述:
1. 负责自动驾驶端侧大模型的部署和优化工作
2. 参与模型部署&优化工具链的研发
3. 对大模型部署优化技术展开研究,并落地到自动驾驶,包括算子实现和优化、投机采样、AI 优化 Kernel 等
任职要求:
1. 有参与模型部署优化的经验,有高性能计算经验者优先
2. 扎实的(Python/C++)编程基础与良好的工程习惯,熟悉常用的数据结构及算法
3. 熟悉 NV GPU 硬件架构与 CUDA 编程模型
4. 熟悉 Claude/Codex/OpenCode 等 Agentic Coding 工具