岗位职责:
1. 参与公司大模型相关算法的研发与实验;
2. 协助完成模型性能评估与数据分析,推动算法优化与效果改进;
3. 跟踪前沿论文与开源项目,探索前沿技术在实际业务或平台中的落地路径;
4. 与算法、工程团队紧密协作,参与模型调研、对比实验及技术分享等工作。
岗位要求:
1. 计算机、人工智能、电子工程、数学等相关专业,硕士或优秀本科在读,具备扎实的基础和良好的代码能力;
2. 对大模型领域充满好奇与热情,有强烈的学习能力与探索欲望,愿意主动钻研前沿技术,具备独立阅读英文论文的能力;
3. 熟悉主流深度学习框架(如 PyTorch、TensorFlow 等),有 NLP / 多模态 / LLM 相关项目经验者优先;
4. 熟练使用 Python 编程语言;
加分项:
1. 有参与开源项目的经验或个人模型调研项目;
2. 熟悉模型训练优化技术,如LoRA、PEFT、混合精度、MoE、RAG等任一者。