岗位职责:
1、协助业务侧大模型相关数据的整理、采集与预处理,包括但不限于语音转写文本、长文本记录、结构化标注数据等,进一步构建大模型效果评估与验证数据集。
2、协助大模型在摘要生成、重点提取、结构化信息输出等方向的效果评估工作,对不同模型、不同 Prompt 或策略在真实业务场景下的表现进行对比分析,为模型选型与方案决策提供依据。
3、协助大模型工程化应用的技术专项支持,包括评估指标设计、评测脚本编写、结果分析与报告输出,推动大模型能力在实际产品中的稳定落地。
任职要求:
1、具备良好的大语言模型 / NLP / 多模态或相关 AI 工程化基础,对大模型应用与落地有基本认知;
2、具备一定的数据分析与工程能力,协助其他伙伴基于具体业务场景设计合理的评估方法或评测流程;
3、具备 Python 基础,能够进行数据处理、评测脚本编写或简单工具开发;
4、对大模型效果评估、模型选型、Prompt 设计等方向有兴趣,具备良好的逻辑分析与总结能力。
加分项:
1、有大模型 API 使用经验(如摘要、信息抽取、文本生成等应用场景);
2、有 NLP、信息抽取、文本摘要或相关项目经验;
3、有开源项目、技术博客、课程项目或科研实践经验者优先;
4、对 AI 在真实产品(如语音、内容理解、智能硬件等)中的落地应用有强烈兴趣者优先。