岗位职责(具体工作内容)
* 日常评测线上用户数据,并梳理评测效果,持续迭代产品体验
* 深入产品应用场景,基于业务目标与用户价值,构建多维评测指标体系与示例
* 结合 AI 能力落地需求,提出可衡量的业务效果指标
* 定义场景化数据集与基准任务,辅助团队持续追踪模型在真实业务场景中的表现
* 利用模型构造评测数据
* 与算法、产品,设计等团队保持高频沟通,推动评测结果反哺决策与产品迭代
任职资格(学历、目标院校、语言、技能、性格等要求)
* 本科及以上学历,计算机、数据科学、工程或相关技术背景优先
* 了解机器学习 / 大模型评测方法,参与过模型评测框架、Benchmark 或 A/B 实验体系建设
* 能将抽象业务目标拆解为量化指标,并用数据驱动迭代;具备优秀的 SQL / Python 数据分析能力优先
* 具备强烈的 业务 sense 与用户同理心,能够在快速变化的环境中独立推进项目落地
* 出色的跨团队沟通与项目管理能力,能够平衡算法可行性与商业价值
* 热爱 AI 与前沿技术,享受在高成长、高挑战的环境中持续学习并创造影响力