【留用实习】AIGC推理系统开发工程师
2026-03-24 18:04:14 刷新
薪资面议 北京 本科 4天/周 实习1个月 提供转正机会
节日福利双休转正餐补健身房
微信扫码同步查看
投递方便通知及时
扫码手机查看
投个简历
职位描述:
1、推理引擎开发与优化: 参与 Diffusion 模型推理引擎的核心模块开发,学习并实践 CUDA 编程、算子优化与内存管理。协助将最新的学术优化手段(如 Flash Attention、Fused Kernels)落地到生产环境,提升模型推理速度; 2、模型压缩与加速:调研并实践模型压缩技术,包括量化、蒸馏和剪枝。参与将 FP16/BF16 模型转换为 INT8/FP8 格式,并在保证生成质量的前提下优化推理延迟; 3、网关与服务化系统建设:参与 AIGC 网关系统的后端开发,设计高并发、低延迟的请求调度逻辑。协助构建模型服务化接口,解决大规模推理请求下的队列管理与资源调度问题。
投递要求:
简历要求: 中文
截止日期:2026-06-17
工作地点:
北京/北京/海淀区上地元中心
求职中若出现虚假宣传,收取财物等违法情况。请立即举报
投个简历
公司简介

职位百科

为你揭秘各职业的工作内容|薪资水平…

后端开发工程师

百科详情

负责计算机产品的服务器端研发,通过代码、API 和数据库集成构建服务端架构,提高网站、应用程序或软件的运行效率,为前端提供支持的专业技术人员。