岗位职责:
1. 参与网约车交易市场部(MPT)司机智能助手相关的大模型 Agent 设计与应用,包括对话理解、任务拆解与规划、工具调用与集成等;
2. 运用 SFT、RL 等后训练方法,提升大模型在多步推理、RAG 增强生成、工具调用、智能问答与自主规划等方面的能力;
3. 通过 Agentic 方法构建合成数据支持训练,设计奖励函数与优化机制,提升模型在垂直领域的泛化能力,探索少样本/无样本的 Agent 优化路径;
4. 跟踪 LLM 与 Agent 领域国际前沿技术,推动工具集成、复杂推理、数据洞察、多 Agent 协作等方向的技术落地与突破。
任职资格:
1. 计算机、人工智能、数学等相关专业在读本科高年级或研究生;
2. 具备良好的 Python 编程基础,了解机器学习与深度学习基本方法;
3. 在大规模预训练、模型对齐、强化学习、RAG、Agent 等至少一个方向有项目经验与洞察;
4. 动手与编程能力强;
5. 可保证每周实习 ≥ 4 天,实习期 ≥ 3 个月。