岗位职责
1. 与名校教授团队合作,参与和主导 LLM 大语言模型的核心算法设计与研发,包括但不限于高质量数据清洗、模型质量评估、预训练(Pretrain)、监督微调(SFT)、强化学习算法优化(RLHF)等,推动大模型的底层技术创新。
2. 结合教育、医学或金融等业务场景,探索和实现 LLM 在实际业务中的落地应用,提供创新性解决方案并优化现有流程。
3. 分析和解决实际问题,推动大语言模型技术在行业内的突破性应用。
岗位要求
1. 学历背景:
• 计算机科学、人工智能、机器学习或相关领域的学士及以上学位,硕士或博士学位优先;名校背景或知名研究机构经验者优先。
2. 学术与研究能力:
• 在 NLP 领域顶会(ACL/EMNLP/NeurIPS/ICML 等)发表过相关论文者优先。
• 对主流预训练语言模型(如 BERT、GPT、T5、PaLM、GLM、Bloom、LLaMA 等)有深入理解和实践经验。
3. 技术能力:
• 熟练掌握主流深度学习框架(TensorFlow 或 PyTorch),并有实际项目经验。
• 熟悉大规模模型训练工具(如 Megatron-LM、DeepSpeed),有分布式模型训练经验者优先。
• 具备高效 prompt 生成与优化的设计与实现能力,并能够评估效果。
4. 基础能力:
• 扎实的数学基础和算法分析能力,能够快速理解和应用最新学术研究成果。
• 对数据挖掘、自然语言处理、模型评估及优化等领域有系统了解,并能够独立完成复杂任务。
5. 其他加分项:
• 有实际教育、医学或金融领域的 LLM 应用经验,能够结合业务需求设计技术方案。
• 优秀的沟通能力和团队协作精神,能够在跨领域团队中高效工作。
职业发展机会
1. 深入参与前沿 LLM 技术研发,拓展研究和业务结合的能力。
2. 直接接触实际场景,积累多领域 LLM 应用经验,提升行业竞争力。
3. 参与教育、医学、金融等领域的创新技术应用,推动业务数字化变革。
4. 有机会获得推荐信或者长期实习工作的机会。