职责描述:
(可base北京/广州/上海/深圳)
加入我们,驱动自动驾驶的未来!
现正积极招募对大模型技术充满热情的实习生。如果你对VLM(视觉语言模型)、VLA(视觉语言动作模型)、世界模型、视频生成或强化学习有浓厚兴趣或研究经验,欢迎加入我们,共同探索自动驾驶技术的边界!
职位亮点
• 前沿技术探索:深入参与多模态大模型、生成式世界模型、强化学习等尖端技术在自动驾驶领域的应用研究;
• 全流程实践:从数据构建、模型设计、训练优化到评测部署,全面参与自动驾驶大模型的研发全流程;
• 丰富资源支持:提供大规模真实驾驶场景数据集与充足计算资源,支持技术创新与突破;
• 成果转化与发表:开放的技术氛围,支持顶会论文发表与专利申请,优秀成果有望落地应用;
岗位职责
• 参与VLA/VLM算法研发,探索视觉-语言-动作模型在自动驾驶决策规划中的应用;
• 开展生成式世界模型研究,包括状态建模、轨迹预测与端到端规划;
• 运用强化学习/模仿学习技术,提升模型在复杂驾驶场景的应对能力;
• 构建多模态预训练与SFT数据集,优化模型泛化性与鲁棒性;
• 跟踪顶级会议最新研究成果,复现开源项目并进行技术验证;
任职要求:
• 硕士及以上学历,计算机、人工智能、机器人等相关专业;
• 熟悉深度学习算法,对CV、NLP、多模态等领域有深入理解;
• 熟练掌握Python/C++,精通PyTorch等深度学习框架,有较强工程能力;
• 具备以下至少一个方向经验者优先:
◦ VLA/VLM模型:熟悉Transformer、Diffusion Policy等,有相关项目经验;
◦ 世界模型:了解Dreamer、Genie2、JEPA等相关工作;
◦ 强化学习:有机器人模仿学习、强化学习相关研究或项目经验;
◦ 视频生成:有相关项目或研究经验;
• 在CVPR、NeurIPS、ICLR等顶级会议发表论文或有相关竞赛获奖经历者优先。