岗位职责(具体工作内容)
1.参与内部Agentic RL相关工作;
2.帮助内部业务完成Agentic RL工作落地;
3.探索Agentic RL前沿技术;
任职资格(学历、目标院校、语言、技能、性格等要求)
1.2027届毕业生,计算机及其相关专业,本科以上学历优先;
2.熟练掌握python/C/C++,有扎实的编程功底,具备良好的编码规范,熟悉面向对象和数据结构;
3.较强的学习能力和技术钻研能力,良好的沟通能力,善于团队合作。
4.有pytorch/deepspeed/verl/sglang等框架开发经验优先
5.熟悉后训练相关的SFT、DPO、RLHF等相关技术的优先