岗位职责:
• 参与大规模语言模型(如GPT、BERT、ChatGLM、LLaMA等)的研究、训练、微调与优化;
• 协助构建高效的大模型训练与推理框架;
• 跟进前沿技术,参与模型压缩、推理加速、提示学习、指令微调等相关研究;
• 配合团队完成算法实现、实验验证与性能调优;
• 撰写技术文档与实验报告,协助论文撰写或专利申请。
任职要求:
• 计算机、人工智能、电子信息、数学、物理等相关专业硕士及以上学历在读(优秀本科生也可考虑);
• 熟悉Python编程语言,具备扎实的算法与工程实现能力;
• 熟悉深度学习框架PyTorch;
• 了解Transformer结构及主流大模型的基本原理;有LLM微调与推理框架使用经验者优先;
• 具备良好的沟通能力和团队协作精神,责任心强,热爱科研和技术探索。