职位描述:
字节跳动豆包大模型团队成立于 2023 年,致力于开发业界最先进的 AI 大模型技术,成为世界一流的研究团队,为科技和社会发展作出贡献。
豆包大模型团队在AI领域拥有长期愿景与决心,研究方向涵盖NLP、CV、语音等,在中国、新加坡、美国等地设有实验室和研究岗位。团队依托平台充足的数据、计算等资源,在相关领域持续投入,已推出自研通用大模型,提供多模态能力,下游支持豆包、扣子、即梦等50+业务,并通过火山引擎开放给企业客户。目前,豆包APP已成为中国市场用户量最大的AIGC应用。
1、与业务团队合作,将字节跳动自研的LLM整合到新的和现有的产品及服务中;通过对用户行为和反馈的研究,确定自研LLM的改进空间,以及相应的改进手段;
2、与技术团队合作,定位在非中市场中LLM对齐训练所需的数据;
3、开发对齐数据采集和生产的方法,确保数据质量保持在高标准,并根据定量和定性反馈不断改进流程;
4、评估数据生产工具对数据生产的有效性和质量的影响;利用LLM本身,不断提高人工和合成数据的效率和效果上限。
职位要求:
1、对LLM对齐及相关方法(如SFT和RLHF)有深入的理解;
2、非常熟练的英语(口语和书面);
3、对LLMs和人类行为有浓厚的兴趣;充满了好奇心,愿意花费时间阅读最新的论文和技术报告;
4、具有协作精神的团队成员。擅长在关注细节的同时,专注于优先目标和大局。