岗位职责:
参与大模型推理平台的后端开发工作,包括 API 设计、数据管理、性能优化等;
参与维护和迭代 Xinference 开源版本,协助修复 bug、补充测试、优化代码结构;
在指导下开发高性能 RESTful API,支持多模型、多任务的并发推理请求;
协助数据库设计与查询优化,确保平台数据访问的稳定性与效率;
支持系统部署与运维相关工作,参与 CI/CD 流程、日志监控与自动化脚本开发;
与团队成员协作,共同推进产品功能实现与技术方案落地;
岗位要求:
扎实的 Python 编程基础,熟悉常用后端框架(如 FastAPI / Flask / Django);
熟悉基础的数据库使用(如 PostgreSQL / MySQL / MongoDB);
有良好的代码规范意识,了解基本的软件工程实践(如模块化、测试、日志等);
熟悉 Git,具备基础的协作开发能力;
对后端工程、开源项目维护、大模型推理等方向感兴趣;
每周至少实习 3 天,实习周期不少于 3 个月(工作能力匹配的话可转正);
加分项:
有参与或使用开源项目的经验,能熟读并分析代码;
熟悉 Docker、Linux 命令行,有一定的部署经验;
对大模型推理框架(如 vLLM、TGI、LMDeploy 等)有了解或兴趣;
有自己主导或参与的后端项目经历(个人项目或课程项目皆可)。