【岗位职责】
1.算法研究与应用架构设计:根据实际需求,将前沿技术应用在垂类业务中,并协助大模型应用的架构设计及优化。
2.算法工程化落地:参与现有项目的产品化落地,包括大模型的推理加速,量化和部署。参与检索增强生成研发以及高效微调训练。
【岗位要求】
1.专业要求:本岗位主要面向双一流大学的计算机、数据科学、电子信息、自然语言处理以及人工智能等相关专业的本科、硕、博士研究生。
有扎实的代码功底,学习能力强,能根据需求快速了解相关知识。
2.编程技能:熟练掌握Python、C++等编程语言以及PyTorch、Tensorflow等主流深度学习框架,能快速熟悉开源项目代码结构,拆分功能代码模块。熟悉向量化数据库的使用及高效数据检索实现。
3.软件技能:熟练使用Linux操作系统,懂得虚拟环境的搭建、了解知名厂家模型API的调用和调参以及常见编程工具的使用。
4.团队技能:热爱学习新知识新技能,工作积极主动、认真负责,善于沟通以及团队合作。有面对挑战迎难而上的斗志与激情。
【加分项】
1.在校期间有参与产品化落地的项目经历。有大模型应用(如智能客服、RAG、工具调用等)相关项目经验。
2.了解vLLM, Deepspeed等开源推理框架,有推理加速相关经验。
3.有相关顶尖学术会议如ICML/NeurIPS/ICLR/ACL/EMNLP/NAACL发表论文或参加相关工作。
4.具有Kaggle、ACM等比赛实战参赛经历。
【其它福利】
1、可开实习证明,有转正机会;
2、4-5天/周,上班时间10:00-18:00/9:30-18:30;
3、包住宿或提供房补;
4、免费零食、饮料、水果、冰棍儿、茶叶。