算法实习生
2026-05-08 14:35:20 刷新
薪资面议 上海 本科 5天/周 实习6个月 提供转正机会
可转正实习周末双休远程办公居家办公
微信扫码同步查看
投递方便通知及时
扫码手机查看
投个简历
职位描述:
岗位职责 你将参与以下一个或多个方向(按兴趣与背景匹配): 对话与语言模型方向 •大模型微调、量化(GPTQ / AWQ / GGUF)、推理加速(vLLM / SGLang / TensorRT-LLM); • 围绕 Agent 框架做 Prompt 设计、工具调用(Function Calling)、意图识别与 路由; • RAG 流水线优化:检索召回、重排、知识图谱融合、长上下文压缩。 Agent Harness 方向(自研框架核心) • 参与自研 Agent Harness 的设计与迭代:上下文窗口管理、工具调用解析、流 式与中断、错误恢复、SubAgent 编排; • 复现并对比 OpenClaw / Hermes / Claude Agent SDK / LangGraph 等开源 Harness 的关键设计,沉淀到自研框架; • 在 SWE-bench / Terminal-Bench / τ-bench 等公开 Agent 基准上做评测与消 融,推动 Harness 各模块的版本迭代; • 设计 Agent 的 Tracing、Replay、Eval 基础设施,让每一次 prompt / 工具改动 都有可量化的回归依据。 Agent 记忆系统方向 • 设计与实现多层级记忆架构:会话级工作记忆、跨会话情节记忆、用户画像式 语义记忆; • 调研与落地 Mem0 / Zep / LangMem 等开源方案,或基于向量数据库(Qdrant / Milvus / pgvector)自研; • 解决记忆冲突合并、衰减策略、检索精度与召回延迟之间的平衡。 语音方向 • 流式 ASR的部署、定制词表、领域口音适配; • TTS 模型的低延迟流式合成、CUDA Graph 优化; • VAD、端点检测(EOT / Turn Detection)、语义级轮次判断。 任职要求 • 计算机、人工智能、电子、数学等相关专业本科及以上在读,每周到岗 ≥ 5 天,连续实习 ≥ 6 个月; • PyTorch 熟练,看得懂主流模型代码(Transformers 等),能独立训练与调 优; • 熟悉至少一个方向的主流模型族(LLM / ASR / TTS / Retrieval)原理与代表性 论文,或对 Agent 系统设计有自己的理解; • Python 工程能力扎实,熟悉 asyncio、FastAPI、Linux + GPU 开发环 境; • 对前沿技术有热情,会主动跟 arXiv / GitHub 趋势,看到新模型 / 新 Agent 框 架愿意自己跑一跑。 加分项 • 有 SOTA 模型微调、蒸馏、量化或推理优化的实战经验; • 熟悉 vLLM / SGLang / TensorRT / Triton 等推理框架的源码或配置; • 读过或自己实现过 Agent Harness(OpenClaw / Hermes / Claude Agent SDK / smolagents / LangGraph 任一); • 在 SWE-bench / Terminal-Bench / GAIA / τ-bench 等 Agent benchmark 上跑过 实验,了解 Harness 设计如何影响最终分数; •用过或读过 Mem0 / Zep / LangMem / LlamaIndex 的核心实现; • 在 HuggingFace、GitHub 有过开源贡献,或有 Kaggle / AI 评测竞赛获奖经 历; 我们能提供 • 多卡 GPU 集群直接可用,不用排队抢资源; • 接触当下最前沿的开源模型与 Agent 框架,从论文到生产化的完整链路; • 直接参与一套真正在生产环境跑的 Agent Harness 的设计演进,而不是套壳调 API; • 与 senior 工程师 1-on-1 协作,没有中间层、没有 PPT 文化; • 表现优秀者优先转正 / Return Offer,或长期 RA / 兼职合作; • 灵活工作方式(远程)
投递要求:
简历要求: 中文
截止日期:2026-05-23
工作地点:
上海市/上海市/黄浦区
求职中若出现虚假宣传,收取财物等违法情况。请立即举报
投个简历
公司简介

职位百科

为你揭秘各职业的工作内容|薪资水平…

算法工程师

百科详情

利用算法原理处理事物的人员。