岗位特色:
岗位可以线上参与,相对灵活自由。薪资不设限,最高日薪过千。
岗位职责:
对大语言模型(LLM)训练所需的文本数据进行高质量标注、清洗与校验;
参与指令微调(SFT)数据的构造,包括但不限于:
编写/改写高质量问答对(Instruction-Response)
判断回答的相关性、准确性、安全性与逻辑性
对多轮对话进行连贯性评估与修正
协助完成人类反馈强化学习(RLHF) 中的偏好排序(Preference Ranking)任务;
发现并反馈数据中的系统性偏差、敏感内容或逻辑漏洞;
参与项目试标、测试质检与标准优化,对新人团队进行培训等等管理工作。
任职要求:
本科及以上学历,大四或研究生,时间相对充裕;
中英文、小语种、新闻、语言学、心理学、计算机、金融、医疗等相关专业优先;
中文功底扎实,语感敏锐,能精准判断语言表达的合理性与自然度;
具备良好的逻辑思维与批判性思维能力,能识别事实错误、逻辑矛盾;
细心、耐心、责任心强,能长时间专注处理文本任务;
熟练使用办公软件(Word/Excel),适应在线协作工具;
加分项:
有AI数据标注、内容审核、编辑校对经验;
了解大模型基本原理(如Transformer、SFT、RLHF);
英语良好,可处理中英双语数据。
备注说明:公司直接服务于众多头部互联网企业,和大模型公司,业务方向多,潜力巨大,薪资上限高,欢迎到岗实习。