【留用实习】AIGC推理系统开发工程师实习招聘-快手实习生招聘-实习僧

【留用实习】AIGC推理系统开发工程师

2026-03-24 18:04:14 刷新

薪资面议北京本科 4天／周实习1个月提供转正机会

节日福利双休转正餐补健身房

微信扫码同步查看
投递方便通知及时

扫码手机查看

投个简历

职位描述：

1、推理引擎开发与优化： 参与 Diffusion 模型推理引擎的核心模块开发，学习并实践 CUDA 编程、算子优化与内存管理。协助将最新的学术优化手段（如 Flash Attention、Fused Kernels）落地到生产环境，提升模型推理速度；
2、模型压缩与加速：调研并实践模型压缩技术，包括量化、蒸馏和剪枝。参与将 FP16/BF16 模型转换为 INT8/FP8 格式，并在保证生成质量的前提下优化推理延迟；
3、网关与服务化系统建设：参与 AIGC 网关系统的后端开发，设计高并发、低延迟的请求调度逻辑。协助构建模型服务化接口，解决大规模推理请求下的队列管理与资源调度问题。

投递要求：

简历要求：中文

截止日期：2026-06-17

工作地点：

北京/北京/海淀区上地元中心

求职中若出现虚假宣传，收取财物等违法情况。请立即举报

投个简历

公司简介