【大模型算法实习生】
工作内容:
深入参与垂类场景Agent大模型的预训练、后训练、高质量数据飞轮,构建多维度自动评估体系链路闭环构建领域对话大模型。
具体工作:
1.支持预训练和后训练任务,并在导师指导下完成 PPO/DPO/GRPO 等算法应用及改进,支持大模型分布式训练实验。
2.参与构建领域Agent数据飞轮:基于业务场景设计可插拔的用户画像策略,实现支持高质量数据飞轮,兼顾可控性与多样性。
3.参与线上模型优化和能力迭代。
任职资格(学历、目标院校、语言、技能、性格等要求)
1.计算机/AI相关专业本科或硕士在读,至少可实习 4 个月、每周至少3 天。
2.熟练Linux 系统常用命令、Python 、PyTorch、SQL
3.熟悉 NLP 基本任务、深度学习,了解大模型基本原理、强化学习、LLM评估
4.熟悉大模型基本原理,有大模型训练经验。
5.对Agent、强化学习等有浓厚兴趣,自主钻研能力。