用户平台部（2）算法实习生实习招聘-滴滴实习生招聘-实习僧

用户平台部（2）算法实习生

2025-08-22 18:25:36 刷新

200-300/天北京本科 3天／周实习4个月提供转正机会

班车晚餐实习证明

微信扫码同步查看
投递方便通知及时

扫码手机查看

投个简历

职位描述：

岗位职责（具体工作内容）
【大模型训练实习生】
工作内容：
深入参与垂类场景Agent大模型的预训练和后训练，构建领域对话大模型。
具体工作：
1.支持预训练和后训练任务，并在导师指导下完成 PPO/DPO/GRPO 等算法应用及改进，支持大模型分布式训练实验。
2.协助构建奖励模型：偏好数据清洗、特征工程、鲁棒性测试，跟踪实验指标及可视化分析。
3.驱动效果闭环：搭建离线多维度指标与在线 A/B 体系，打造自迭代数据飞轮。
任职资格（学历、目标院校、语言、技能、性格等要求）
1.计算机/AI相关专业本科或硕士在读，至少可实习 4 个月、每周至少3 天。
2.熟练Linux 系统常用命令、Python 、PyTorch、SQL
3.熟悉 NLP 基本任务、深度学习、强化学习
4.熟悉大模型基本原理，有大模型训练经验。
5.对 RLHF、奖励模型等有浓厚兴趣，自主钻研能力。

投递要求：

简历要求：中文

截止日期：2025-12-31

工作地点：

北京

求职中若出现虚假宣传，收取财物等违法情况。请立即举报

投个简历

公司简介