岗位职责:
方向一:NLP算法实习生(大模型数据工程)
具体职责:
1. 参与基于大模型的相关应用研发,包括但不限于文本生成、信息抽取、工具和插件使用、对话决策等;
2. 参与SFT数据self-instruct、数据质检与筛选、data scaling law、用户口语化数据挖掘与生成、数据多样性复杂性评估;
3. 参与团队内部的技术分享和交流,不断提升自己的技术水平;
方向二:NLP算法实习生(大模型Function Call方向)
具体职责:
1.任务特定微调(SFT):参与研究和开发Function Call技术,提升模型在自然语言处理任务中与外部工具、API的交互能力。实验自监督学习(Self-supervised Learning,SSL)和强化学习(Reinforcement Learning,RL)技术,提高模型的泛化能力。
2.Function Call前沿探索:实验工具学习(Tool Learning)方法,探索如何通过少量标注数据更高效地学习API选择和调用,优化多任务学习(Multi-task Learning),增强模型对不同API的理解和操作能力。
3.模型评估与优化:基于性能评估指标(如准确率、召回率、F1分数等),评估SFT微调后的模型表现,并不断优化模型在Function Call任务中的效果,使用数据增强、迁移学习、对抗训练等技术持续提升模型的能力。
方向三:NLP算法实习生(对话算法方向)
具体职责:
参与数据和模型研发
1. 负责基于工具使用及任务规划模型知识增强链路的数据和模型相关研发,包括但不限于:优化线上现有问题,如必过集 badcase、点踩数据等;搭建 few-shot 知识库(如产品策略库、外部知识库、基于对话历史摘要总结);增强模型 few-shot 检索能力,并参与数据预处理、模型训练和优化工作。
2 投身小布通话的数据和模型研发工作,涵盖目标引导的受控对话生成、应答话术优化、定制化应答策略实现、关键信息抽取和摘要等能力的开发与优化。
任职要求:
1. 计算机、数学、统计学等相关专业;
2. 熟悉自然语言处理(NLP)的基础理论和算法,掌握常见深度学习框架,并具有较好的实践能力;
3. 熟悉强化学习相关的基础理论, 有相关的实践经验;
4. 具备良好的团队合作精神,能够积极主动地与团队成员沟通和协作;
5. 有相关实习或项目经验者优先。