大模型评测工程师实习生
2025-10-10 10:10:08 刷新
200-250/天 上海 硕士 5天/周 实习4个月
周末双休
微信扫码同步查看
投递方便通知及时
扫码手机查看
投个简历
职位描述:
岗位职责 1.OpenCompass 框架二次开发与优化 深入基于 OpenCompass 框架进行二次开发,定制评测流程与接口,提升评测效率与自动化水平。 构建与维护完整的评测管线,从任务配置、模型调用到结果收集及报告输出,实现端到端流程一体化。 2.丰富评测集覆盖与执行。 熟练运行多类型常见评测集,覆盖以下几类(含但不限于):通用任务类、STEM类、代码生成类、智能体类、主观评测类等; 能根据业务需求,扩展或开发新的评测集与任务类型。 3.评测任务适配 编写脚本,将不同评测数据集适配进 OpenCompass 的任务配置,实现自动执行评测任务。 4.评测结果分析与反馈 能够根据评测结果撰写报告,进行模型版本之间在不同任务上的横向对比与可视化展示。 分析模型表现差异,定位瓶颈并提出改进建议,支持模型优化落地。 5.技术协作与文档维护 与模型开发与训练团队紧密协作,确保评测流程与训练流程无缝衔接。 编写并维护技术文档,输出操作指南与评测报告,保障内部评测体系的可持续使用。
投递要求:
简历要求: 中文
截止日期:2026-09-20
工作地点:
上海市/上海市/徐汇区 国际传媒港F1栋
求职中若出现虚假宣传,收取财物等违法情况。请立即举报
投个简历

职位百科

为你揭秘各职业的工作内容|薪资水平…

人工智能训练师

百科详情

使用智能训练软件,在人工智能产品实际使用过程中进行数据库管理、算法参数设置、人机交互设计、性能测试跟踪及其他辅助作业的人员。