工作职责
- 负责落地多模态大模型在多模态理解场景中的应用,负责多模态理解与审核场景端到端效果优化与提升;
- 重点研究文本、图像相关的多模态大模型相关的技术,包括但不限于数据建设、指令微调、模型优化、模型蒸馏等。提升数据构建合成、模型推理等能力;
- 构建大小模型融合的多模态推理系统,提升模型在理解与审核场景中的效果;
- 持续探索跟进学术与业界前沿进展,探索包括但不限于多模态CoT、多模态RAG、强化学习微调等能力并落地。
任职资格
- 本科及以上学历,计算机、模式识别、人工智能、软件工程相关专业优先
- 在以下任一方向具有深入研究经验:LLM as a judge、multi agent、图像理解、跨模态对齐与检索等
- 具有多模态大模型相关项目经验,有复杂agent系统、内容审核、多模AI搜索相关产品落地经验者优先
- 有良好的问题分析能力、自我自驱意识、沟通协作能力,能够承受一定的工作压力
- 26年以后毕业,至少实习3个月