职责描述:
参与团队在世界模型(world model),视频生成模型,3D/4D生成模型等相关方向大模型的研发。同时结合自研产品需求,深度参与模型在公司相关场景的应用落地。
【岗位职责】
1、负责相关大模型算法的设计、开发和优化,提高模型的性能和精度;
2、负责模型的训练、测试、验证和部署,保证模型的稳定性和可靠性;
3、负责模型的监控和维护,及时发现和解决模型的问题;
4、参与团队的技术交流和分享,提高团队的技术水平。
任职要求:
1、较强的算法实现能力,熟悉深度学习平台如tensorflow,pytorch等;
2、对前沿的模型相关研究掌握清楚,熟悉Diffusion,Transformer,DiT等生成模型框架;
3、有大模型(视频,3D/4D,多模态)训练实战经验;
4、具有应用大规模神经网络解决相关实际问题的实践经验,能够针对适当的数据和模型的表现,选择恰当的调参、训练任务选择、训练数据增强、目标函数变化等策略来确保超大型模型的训练成功率,并且能够解释策略背后的直觉来源并用严格的数据验证自己的假设。