机器学习引擎实习生
2025-06-26 11:10:02 刷新
250-300/天 北京 本科 5天/周 实习3个月
周末双休地铁周边餐补实习津贴
微信扫码同步查看
投递方便通知及时
扫码手机查看
投个简历
职位描述:
岗位职责: 负责搜推CTR模型和LLM大模型的训练&推理框架的建设和优化。工作内容包括但不限于: 1、基于PyTorch+TorchRec,打造生成式推荐(GR)Infra,支持推荐大模型的迭代; 2、综合运用并行训练策略优化、编译器优化、kernel优化、Embedding压缩等手段,支持CTR模型高效进行scaling law的探索验证; 3、跟进业界LLM训练&推理优化的最新进展,不断提升LLM框架的性能,并在公司内部的多个业务场景下落地; 4、持续探索大模型轻量化推理相关工作(如低精度量化、稀疏化改造、投机采样等),在保证精度可靠的前提下进一步降低模型推理成本。 岗位要求: 1、具备良好的计算机基础素养和分析解决问题的能力,熟练掌握C++或Python; 2、学习能力强,对机器学习系统优化有技术热情,富有极客精神; 3、熟悉常见机器学习、深度学习算法,熟悉TensorFlow/PyTorch/TorchRec等深度框架代码的优先;熟悉Megatron/DeepSpeed/vllm/TensorRT-LLM/LMDeploy/SGLang等大模型框架的优先; 4、熟悉GPU、NPU硬件架构,熟练使用CUDA、Triton、NCCL、RDMA编程的优先; 5、有分布式系统、高性能计算实际项目经验的优先; 6、有MLSys论文发表或者开源项目代码贡献的优先。 岗位亮点: 1、支撑美团核心搜索推荐环节,受关注度高; 2、当前美团核心的GPU&NPU落地场景之一,和团队一起探索学习异构计算领域的前沿技术,个人成长快; 3、工作成果有机会发表高水平论文,或者对业界知名开源项目进行贡献
投递要求:
简历要求: 中文
截止日期:2025-09-26
工作地点:
北京市/北京市/朝阳区 朝来科技园
求职中若出现虚假宣传,收取财物等违法情况。请立即举报
投个简历
公司简介

职位百科

为你揭秘各职业的工作内容|薪资水平…

后端开发工程师

百科详情

负责计算机产品的服务器端研发,通过代码、API 和数据库集成构建服务端架构,提高网站、应用程序或软件的运行效率,为前端提供支持的专业技术人员。