工作职责
- 参与大模型推理框架的设计、开发与优化工作
- 使用 Python / Go 开发和维护推理相关模块,包括但不限于模型加载、推理调度、服务化等
- 协助进行模型推理性能优化(如延迟、吞吐、资源利用率等)
- 配合团队完成技术方案验证、问题定位与调试
- 编写相关技术文档与开发说明
加分项(非必须):
- 有深度学习、机器学习或大模型相关经验
- 了解或使用过 LLM 推理/Serving 框架,如 FastDeploy、vLLM、SGLang 等
- 了解 LLM 推理优化技术(如 KV Cache、Batching、并行/并发调度等)
任职资格
- 计算机科学、软件工程、人工智能或相关专业,本科及以上学历在读
- 熟悉 Python 或 Go 至少一门编程语言,具备良好的编码习惯
- 具备扎实的数据结构与算法基础,对系统开发有兴趣
- 了解 Linux 基本使用,熟悉常见开发与调试工具
- 具备良好的学习能力、沟通能力和责任心,能够按期完成任务