1、多模态推理工作流架构,设计并实现多阶段分布式推理工作流,支持视觉/文本/音频等多模态内容生成任务,负责大模型服务的端到端开发与部署,包括模型集成、API封装及异构资源调度优化;
2、AIOPS平台建设与协作提效,构建面向大模型业务的全生命周期AIOPS平台,覆盖开发、测试、监控全流程,建设标准化工具链与自动化流程,落地跨团队高效协作范式,加速业务迭代与成果转化;
3、Agent应用开发,支持TOC多模态AIGC任务的编排计算,利用Agent能力辅助用户进行复杂视频生成等。1、本科及以上学历,计算机、软件工程、人工智能等相关专业优先;
2、计算机和编程基础扎实,熟练掌握Java或Python,有服务端系统的开发经验;
3、有较强的工作责任心和自驱力,较好的学习能力和沟通能力,良好的工作文档习惯;
4、熟悉大模型推理或训练框架(如vLLM、SGLang、PyTorch等)、云原生编排调度者优先。