工作职责:
职位描述
1. 参与小红书视频消费链路的策略优化,基于强化学习算法构建用户长期体验最优化的决策模型;
2. 负责视频播放场景下的状态建模、奖励函数设计、策略学习与仿真评估,推动强化学习在视频消费场景的落地与迭代;
3. 深入业务数据,挖掘用户行为模式,通过AB实验、因果推断等方法科学评估策略效果,持续驱动算法与体验的双重提升.
任职资格:
任职要求
1. 本科及以上学历,计算机、人工智能、统计学、自动化等相关专业;
2. 熟练掌握强化学习经典算法(如DQN、PPO、SAC等),有相关项目或竞赛经验,具备扎实的机器学习与数据挖掘基础;
3. 优秀的编码与工程实现能力,熟练掌握Python,熟悉TensorFlow/PyTorch等框架,具备大规模数据处理和实验分析经验;
4. 对用户体验敏感,具备良好的业务洞察和问题拆解能力,能够独立完成从问题定义到模型落地的全流程。
我们提供
1. 表现优异者有26年实习转正机会(团队hc多多);
2. 深入小红书核心业务场景,参与高挑战、高影响力的算法项目;
3. 开放、包容的团队文化,提供有竞争力的实习待遇与福利。