【FY25】多模态视觉模型实习生（VLM数据挖掘方向）(A219365)实习招聘-智驾大陆实习生招聘-实习僧

【FY25】多模态视觉模型实习生（VLM数据挖掘方向）(A219365)

2025-05-27 16:48:22 刷新

200-250/天上海硕士 5天／周实习6个月

实习津贴留学生实习节日福利地铁周边

微信扫码同步查看
投递方便通知及时

扫码手机查看

投个简历

职位描述：

职责描述：
1、多模态数据挖掘与优化
（1）调研前沿多模态算法，探索其在低成本自动化数据标注方案以及自动驾驶长尾场景中的应用潜力
（2）参与自动驾驶场景下的真实多模态数据（图像、视频、激光雷达、文本描述）的清洗、标注与特征提取，构建适配视觉语言模型的高质量训练数据集。
2、VLM算法开发与调优
（1）基于真实驾驶数据针对自动驾驶感知任务进行多模态数据利用方式及训练方法的探索，解决使用VLM业务场景落地方面的技术及工程问题
（2）开发多模态数据融合策略，研究时序视频数据、空间信息以及文本语义的联合建模方法
任职要求：
1、教育背景：计算机科学、电子工程、应用数学、人工智能等相关专业硕士/博士在读，具备扎实的深度学习基础
2、技术能力
（1）熟练使用Python，掌握PyTorch/TensorFlow框架，精通深度学习、机器学习、计算机视觉、自然语言处理的基本知识
（2）熟悉常用多模态模型架构，理解Transformer、扩散模型的核心原理，了解大模型预训练算法
（3）具有良好的编程习惯及分析解决问题的能力
加分项
1、善于运用AI工具提效，分析和处理问题
2、有自动驾驶数据集处理经验，或参与过VLM和LLM预训练和分布式训练实际项目经验
3、在CVPR/ICCV/ECCV/NeurIPS等顶会发表多模态相关论文，或开源社区活跃贡献者

投递要求：

简历要求：中文

截止日期：2025-09-30

工作地点：

上海市/上海市/嘉定区智驾大陆(上海)智能科技有限公司

求职中若出现虚假宣传，收取财物等违法情况。请立即举报

投个简历

公司简介