职责描述:
1、深入参与核心研发与前沿算法探索,协助构建端到端的科学智能体评测框架。
2、针对大模型推理(LLM Reasoning)、科学工具调用、复杂任务规划等能力,设计并实现系统级的量化评估指标与测试集。
3、追踪大模型、Agent 以及 AI for Science 领域的最新学术进展,参与前沿算法的复现、实验验证及学术论文撰写。
4、协助进行实验设计、数据分析,并参与顶会学术论文或具有行业影响力的技术报告的撰写。
5、与工程师紧密协作,优化评测流水线,推动评测系统迭代。
任职要求:
1、计算机、人工智能、应用数学、物理、化学或相关专业的全日制在读学生。
2、具备扎实的机器学习/深度学习基础,对 LLM(大语言模型)、Agent 架构及模型推理有深入理解或实操经验。
3、编程能力强,熟练使用 Python,精通 PyTorch 等主流深度学习框架,具备良好的代码规范。
4、具备强烈的自我驱动力、优秀的逻辑思维能力和解决复杂未知问题的热情。
【加分项】
1、有大模型评测、多智能体协作(Multi-Agent System)或强化学习相关项目经验者优先。
2、曾在 NeurIPS, ICLR, ICML, ACL 等顶级人工智能会议或顶尖科学期刊上发表过第一作者论文。
3、熟悉大型语言模型评测机制,或参与过开源 Agent 框架/评测集构建者优先。
4、对物理、化学、生物等自然科学领域有一定了解,对 AI for Science 有浓厚兴趣。
【我们提供】
- 极具挑战性和前瞻性的核心项目,直面 AI for Science 的前沿难题。
- 顶尖的科研团队氛围与资深研究员的亲自指导。
- 充足的计算资源支持。