一、职位描述
主要负责基础模型平台的调试和开发,配合算法专家完成相关需求
1. 人工智能、自然语言处理、多模态和强化学习等领域开展前沿大模型技术探索和研究,推动技术落地和行业变革;
2. 探索基于多模态信息的控制生成技术,与软件研发共同建立mocap、体感服以及数据手套等定制化数据采映射至控制实体的控制大模型;
3. 基于业务需求和业务数据,使用SFT、RLHF、LORA等技术对大模型进行训练和优化;
4. 使用Deepspeed,Magetron等加速训练方案,优化模型训练框架;
5. 参与研发前沿算法,发表国际论文、申请专利;
二、 岗位要求
1. 有扎实的数据结构和算法基础,有较强的实践能力;
2. 熟练掌握python,至少熟悉一种主流的机器学习框架(Pytorch/Tensorflow);
3. 熟悉深度学习算法(Transformer,LLAMA,GPT系列等),有多模态和大模型经验者优先;
4. 有强烈的求知欲、好奇心和进取心。有快速学习新技术的能力,能适应陡峭的学习曲线。
三、加分项
1. 有AI方向顶会论文
2. 有kaggle、COCO、ImageNet、阿里天池、ACM、NOI/IOI等比赛名次