【工作职责】
1. 从事大语言模型(LLM)/多模态大模型(LMM)的研究、调优和应用,包括但不限于训练、调整、优化、评测、推理能力改进、知识融入更新等
2. 从事大模型的大规模训练加速、压缩、量化、蒸馏、微调等技术探索
3. 结合具体业务场景,对大模型进行微调、优化
【能力要求】
1. 至少在职 6 个月以上;
2. 扎实的算法基础,熟悉LLM、NLP相关算法和模型;
3. 具有良好的Python编程能力,熟悉至少一种主流深度学习框架(如 PyTorch、TensorFlow等);
4. 有相关大模型研发项目的经历,能够独立进行模型训练和优化;
5. 有参加过机器学习相关的比赛经历,如Kaggle等,并有一定的排名或者成绩者优先;
6. 能够熟练阅读和撰写英文文档,具有良好的沟通和团队协作能力。