岗位描述:
1、深度参与电信视觉和多模态模型的结构设计,训练数据构造、模型设计、模型性能提升等工作,包括但不限于视觉预训练,跨模态检索等业务应用;
2、参与大模型环境搭建、模型训练、模型优化实验、大模型应用构建;
3、结合电信下游实际业务,对大模型的特定能力进行针对性优化;
4、跟踪视觉大模型方向前沿问题的研究,将业界SOTA方法在电信场景进行产品化落地。"
任职要求:
1、计算机相关专业在读硕士/博士,保证每周五天全职实习时长4个月以上;
2、有大模型训练经验,了解混合精度训练,熟悉Deepspeed等常见大模型训练框架;
3、动手能力强,能快速搭建、验证开源环境,编写代码,对Lora、QLora等微调训练及模型训练推理加速等开源技术有一定实践经验;
4、熟悉相关开源数据集、了解主流的模型数据集构建方法和模型优化方法,能进行快速有效的模型优化实验;
5、在国际CV竞赛中取得优秀名次者、在会议(CVPR/ICCV/ECCV/ICML/NIPS等)有论文者优先;
6、优秀的表达能力、良好的团队合作和沟通能力。"