工作职责
1.参与多模态生成大模型相关技术的攻坚研发与技术创新,主要侧重于全新自回归范式视音频生成;
2.参与多模态理解大模型相关技术的攻坚研发与技术创新,主要侧重于长视频理解、视音联合理解;
3.撰写/发表至少1篇高水平学术论文;
4.支持文心大模型的策略迭代(数据,评估与训练)。
任职资格
1.研究生及以上学历,有视频/音频理解或生成项目经验,熟悉LLM,AR-Diffusion等技术;
2.有一定学术能力,发表过AI顶会论文,算法竞赛获奖或参与大模型开源项目优先;
3.具有自驱力与责任心,具有较好的团队沟通能力,分析问题与解决问题能力,实习6个月优先,有转正机会。