工作职责:
1、研究和开发大模型加速和深度学习领域的算法
2、推动人工智能技术在云计算和互联网方向的落地和发展
任职资格:
1、过硬的科研背景:深度学习/机器学习;多模态大模型训练(包括预训练,微调,强化学习等)
2、扎实的编程基础;
3、熟悉本研究领域的最新研究成果,公开数据集,和相关的开源系统;
4、有很强的自学能力和独立思考能力,善于思考和表达自己的想法;同时又具备良好的团队合作精神;
5、熟悉 Python 等至少一门脚本语言,使用过 Torch, TensorFlow等开源深度学习框架优先;
6、熟悉Llama架构,Qwen架构,有多模态大模型训练,强化学习等相关科研经历者优先;
7、对多模态大模型、AIGC等前沿AI技术有浓厚兴趣和参与经验,短期内能到岗者优先;
8、实习期至少三个月,每周到岗至少三天。