工作职责:
1.清洗、处理大模型微调数据。
2.微调训练和评估大模型。
3.根据实际的业务问题,优化数据的prompt工程以及模型的微调或解码算法。
工作要求:
1.计算机科学、人工智能、自然语言处理或相关专业。
2.具有扎实的编程能力,熟悉Python、Pytorch、megatron LM、deepspeed等主流编程语言和框架。
3.熟悉自然语言处理基本概念和技术,具备机器学习、深度学习、大模型训练和优化相关的知识和经验。
4.具有稳定的实习时间,持续半年以上。
5.良好的团队合作和沟通能力,有在大模型领域深入发展的意愿或职场需求。