职位描述
项目介绍:日常实习,面向全体在校生,为符合岗位要求的同学提供为期3个月及以上的项目实践机会。
团队介绍:字节跳动 Seed 团队成立于 2023 年,致力于寻找通用智能的新方法,追求智能上限。团队研究方向涵盖 LLM、语音、视觉、世界模型、基础架构、AI Infra、下一代 AI 交互等,在中国、新加坡、美国等地设有实验室和岗位。Seed 团队在 AI 领域拥有长期愿景与决心,坚持深耕基础,期望成为世界一流的 AI 研究团队,为科技和社会发展作出贡献。目前团队已推出业界领先的通用大模型以及前沿的多模态能力,支持豆包、扣子、即梦等超过 50 个应用场景。
1.数据标注与质检:参与多个预训练、后训练通用类LLM/VLM训练项目,完成SFT/RM等多类数据的标注与质检任务,确保充分理解项目规则和线上平台的使用,在规定时间内完成符合质量标准的数据交付。
2.数据分析与报告撰写:参与预训练数据的寻源、抓取、评估、Prompt工程,workflow搭建,协同标注团队完成数据交付,协同研发完成自动化流程搭建。参与内部和行业LLM/VLM的预训练和后训练的通用能力评估,包含测试集搭建、Prompt工程、标注规则撰写、评估多学科case(理科、文科、工科),并产出模型效果分析报告。
3.项目管理和跨部门协同:参与设计、管理数理类模型数据项目的项目管理,包括标注规则制定、跟踪项目进展、项目风险识别与解决等,协同内部数据标注团队和外部供应商确保项目按预期交付。与产品经理、研究员、数据标注员及其他跨职能团队成员建立并维护良好的合作关系,参与跨团队、跨职能、跨时区项目会议。
职位要求
1.本科及以上学历在读,具备 STEM 学科(如工程学、数学、计算机科学)或定量 / 分析非 STEM 领域(如社会学、统计学或经济学)的学术背景者优先。
2.LLM/VLM产品的深度用户,有数据标注及质检、数据规则编写、Prompt工程、Agent/Workflow搭建等经验者优先。
3.沟通清晰高效,逻辑思维强,扎实的问题解决能力和执行能力,工作细致认真,踏实负责。
4.对人工智能、大语言模型和人机交互有浓厚兴趣,热衷于学习、实验,并能跨不同内容领域和团队开展工作,适应快节奏、项目制工作环境。
5.加分项:具备英文读写能力,能与全球英文团队顺畅沟通。