职责描述:
1、参与语言大模型在人工智能领域应用的全流程(训练数据构造、模型训练,模型效果评估)工作
2、在大模型方向的本地模型定制、算法优化、效率及稳定性提升、大模型应用等方面持续优化迭代
3、紧跟前沿技术进展,参与关键创新,实现业务价值
任职要求:
• 在读硕士、博士,计算机、人工智能、软件、机器人等相关专业
• 具备扎实的 Python 开发基础,熟练掌握 PyTorch 、deepspeed等主流
• 熟悉 前沿SOTA 模型架构与训练方法,如多模态模型、自监督学习、迁移学习,模型蒸馏等
• 有大模型搭建(如7B,13B,33B等等参数量)、模型开发全流程(数据采标清洗、模型设计调优、性能评测诊断等)等经验者优先
• 有语言大模型、机器学习等方向开源项目维护/贡献经历或相关方向高水平论文发表者优先
• 有创新的想法,乐于接受技术挑战,具备一定的英文读写能力、较好的沟通能力、良好的团队合作精神
• 可实习6个月优先考虑