团队介绍:快手多模态大模型(Keye)团队,作为行业内少有的「基座研发 + 业务落地」双轮驱动的团队,致力于打通从Data到Product的最后一公里。1、深耕基座:攻坚多模态基座核心架构,探索Scaling Law的极致边界。2、数据为王:构建工业级数据清洗与自动化评测体系,用高质量数据重塑智能。3、进化智能:突破强化学习与推理增强技术,让模型更聪明、更可控。4、全域落地:赋能快手全生态,让AI在电商、商业化、推荐等众多真实场景中创造价值。
1、负责大模型的强化学习算法研究与开发,优化模型训练效果、稳定性和效率;
2、深入研究强化学习领域的前沿技术,结合公司业务场景,探索新的算法优化方向,保持公司在该领域的技术领先性;
3、探索强化学习阶段的多目标强化学习、奖励模型设计等技术方向,提升模型在复杂任务中的表现;
4、撰写技术报告和论文,分享研究成果,推动团队技术水平提升。