1、 工作内容及基本职责:
参与大语言模型应用场景需求调研和分析工作;
负责模型架构、调优、实验反馈、迭代全周期工作;
大模型应用场景后端开发工作;
数据采集、清洗和模型训练。
2、 任职资格:
教育背景:硕士研究生在读(研一、研二尤佳),数学、计算机、统计学相关专业
岗位要求:具有web项目或大语言模型开发相关工作经验;熟悉常用数据结构与算法,TCP/IP协议栈,以及数据库、缓存、消息队列等技术。
3、 专业知识要求:
熟练掌握linux操作系统、机器学习、神经网络相关知识与技能;
熟练使用常规编程语言如 Python、 Java、C++。
有以下项目经验者优先:
1、 熟悉Pytorch/Tensorflow等主流深度学习框架并能进行相关优化;
2、 有大规模数据并行、模型并行、流水线并行等技术实践经验;