职位描述
项目介绍:日常实习,面向全体在校生,为符合岗位要求的同学提供为期3个月及以上的项目实践机会。
团队介绍:字节跳动 Seed 团队成立于 2023 年,致力于寻找通用智能的新方法,追求智能上限。团队研究方向涵盖 LLM、GenMedia、AI for Science、机器人等,在中国、新加坡、美国等地设有实验室和岗位。
Seed 团队在 AI 领域拥有长期愿景与决心,坚持深耕基础,期望成为世界一流的 AI 研究团队,为科技和社会发展作出贡献。目前团队已推出业界领先的通用大模型以及前沿的多模态能力,支持豆包、扣子、即梦等超过 50 个应用场景。
1、协同数据工程师与算法团队,对原始训练数据进行收口、分类、清洗、脱敏、结构化;深入理解各类数据的来源、特性与用途,确保数据质量与合规性;
2、与技术、产品和运营团队紧密合作,梳理数据内在逻辑,建立能用于模型训练的数据资产,建立和维护数据标签,满足不同业务方对数据的检索诉求;
3、开发数据看板与相关产品,以提升管理透明度、提高数据生产效能;
4、负责其他不同数据源的挖掘探索。
职位要求
1、本科及以上学历在读;
2、具备数据分析相关经验,能熟练使用SQL、Python进行数据分析;
3、熟悉数据结构,能够准确地将数据转化为核心指标,确保数据的准确性与一致性;
4、对数据敏感,具备数据分析、挖掘、清洗与建模经验;
5、对大语言模型(LLM)、以及对人类行为、体验和幸福感的理解有浓厚兴趣,保持热情并致力于持续学习。