职位描述
日常实习:面向全体在校生,为符合岗位要求的同学提供为期3个月及以上的项目实践机会。
团队介绍:字节跳动 Seed 团队成立于 2023 年,致力于寻找通用智能的新方法,追求智能上限。团队研究方向涵盖 LLM、语音、视觉、世界模型、基础架构、AI Infra、下一代 AI 交互等,在中国、新加坡、美国等地设有实验室和岗位。
Seed 团队在 AI 领域拥有长期愿景与决心,坚持深耕基础,期望成为世界一流的 AI 研究团队,为科技和社会发展作出贡献。目前团队已推出业界领先的通用大模型以及前沿的多模态能力,支持豆包、扣子、即梦等超过 50 个应用场景。
1、参与多个代码类大语言模型(LLM)训练项目,确保按时交付、符合质量标准并达成目标;跟踪项目进展,识别风险,并采取必要的纠正措施以保证项目按计划推进;与产品经理、研究员、数据标注员及其他跨职能团队成员建立并维护良好的合作关系;同步项目进展,解决问题并协调各方期望,确保项目成功交付;组织与各区域团队的会议及讨论,确保项目顺利执行,并根据需求协调外部供应商及培训师;
2、设计、管理并优化代码类LLM训练项目的工作流程,包括训练设计、质量保证(QA)流程及效果追踪,以满足项目需求,与产品经理、项目负责人及跨职能团队紧密协作,确保质量标准与项目目标保持一致;
3、制定并维护技术指南及案例手册,确保数据生产的高质量与一致性,设计并实施稳健的数据分析策略,系统评估训练集与验证集质量;通过统计建模、可视化分析及编程方法,全面监测标注质量、模型表现及数据集覆盖度,采用分片评估、提示词敏感性测试及聚类错误分析,精准识别数据缺口、边界案例与失效模式;运用Python(Pandas/NumPy/Matplotlib)及SQL工具链,生成可落地的改进建议,保障数据管道健康度;与模型训练标注员及研发紧密协作,基于数据洞察指导训练策略调整,推动以数据为核心的项目迭代。
职位要求
1、本科及以上学历在读,计算机科学、相关技术领域专业;
2、优秀的沟通与问题解决能力,能清晰理解并传达代码相关概念,扎实的项目管理能力,擅长设计、管理及优化复杂工作流程;
3、具备英文读写能力,能与各区域英文团队顺畅沟通;
4、兼具独立判断与团队协作能力,适应快节奏、项目制工作环境,对大语言模型(LLM)和计算思维有浓厚兴趣。