1. 开展GPT系列或者其他开源大模型的开发和调优工作,包括Pretrain,指令微调、Prompt工程以及面向下游任务的效果优化等
2. 完成大规模预训练模型在智能AI情感陪伴等场景中的应用落地,支持业务目标提升
3. 紧跟业界大模型进展,探索前沿技术,包括LLM、SFT、强化学习等
4. 与其他团队密切合作,包括数据工程师、前后端工程师、产品经理等,实现高质量的产品和解决方案
职位要求
1. 有大语言模型(LLM)预训练/微调经验, 熟悉相关技术细节和优化策略,如大规模语料收集、模型调优优化、自弱监督学习、强化学习等
2. 具有扎实的算法理论基础,熟练掌握大语言算法模型,熟悉主流大模型,如ChatGPT/T5/qwen/LLaMA/GLM/BaiChuan等,对模型背后的原理和各自适用场景有一定的理解
3. 有基于PyTorch等深度学习框架的实战项目经验;
4. 了解DeepSpeed、Megatron等分布式框架原理及应用优先
5. 具备较强的团队协作能力和沟通能力,有较强的学习能力和业务分析及问题解决能力
6. 良好的paper阅读习惯和实现能力
加分项:
1. 具有生成式模型训练及开发经验优先
2. 有参与过数字人对话落地项目优先
3. 有NLP、多模态研发背景,有智能对话、开放域对话机器人相关领域应用有深入理解的优先
4. 对大规模预训练语言模型技术现状和发展趋势有深刻的理解和认知,并对相关技术有极高的热情
5. 发表过大模型相关研究AI顶会论文优先
6. 具备有良好的代码开发能力,有开源项目开发经验优先
岗位福利:
1. 团队气氛良好,成员都来自一线互联网大厂或者国内外名校
2. 做AIGC研发环境好,公司内有丰富的大模型研究、落地的场景及算法经验,大量的数据资源,充足的标注和机器资源