职位描述:
这个职位是连接前沿AI技术与硬核科学知识的桥梁。你将不再仅仅是知识的研究者,而是整个知识增强项目的核心枢纽,负责管理从需求理解到数据交付的全链路流程,确保大模型在数理化生、工程技术等领域的逻辑推理、复杂计算与科学问题解决能力得到高效、高质量的提升。
核心职责:
1. 训练需求理解与转化:
与算法、产品团队紧密协作,深入理解大模型在数理化生、工程学等领域的能力短板与迭代目标(如高等数学解题、物理现象推演、化学反应预测、生物学机制阐释、工程原理应用等)。
将模糊的“模型能力提升需求”精准转化为清晰、可执行的数据生产任务与项目目标。
2. 数据项目运营与管理:
负责高精尖理工科数据生产项目的全生命周期管理,包括制定项目计划、定义严谨的数据标准、监控生产进度与风险。
设计并优化数据生产的工作流,探索并落地可规模化、高效率的数据生产模式(例如,利用工具辅助生成结构化的解题步骤、公式推导过程等),确保项目按时、按质、按量交付。
3. 数据质量验收与迭代:
建立并执行严格、可量化的数据验收标准与质检流程,对产出的理工科知识库、解题过程数据、实验设计方案、评测数据集等进行专业评估与验收。
对数据质量问题(如逻辑谬误、计算错误、与科学事实不符等)进行归因分析,形成反馈闭环,持续指导和优化数据生产策略,推动数据质量的迭代提升。
4. 专家资源管理与赋能:
负责理工科领域专家资源(如高校师生、科研人员、资深工程师等)的招募、培训与日常管理,构建并维护高质量的外部专家智库。
为专家提供清晰的任务指引和必要的赋能培训,确保他们能够高效、准确地产出符合科学规范的数据,并对专家工作质量进行评估与管理。
职位要求:
1. 有过大模型数据相关实习经历,了解大模型训练和评估的基本链路,对数据生产、标注、评估等环节有实践经验者优先。
2. 本科及以上学历在读,数学、物理、化学、生物科学、材料、机械、电子工程、自动化等理工科专业背景者优先。
3. 具备出色的项目管理和流程设计能力,能够将复杂的科学问题拆解为清晰的执行步骤,并推动落地。
4. 逻辑思维极其严谨,具备扎实的科学素养,不仅能发现问题,更善于分析问题背后的根本原因,并提出系统性的解决方案。
5. 优秀的沟通协调与人际交往能力,能够清晰地传达专业需求,高效地管理和协同内外部资源。