职责描述:
1、多模态数据挖掘与优化
(1)调研前沿多模态算法,探索其在低成本自动化数据标注方案以及自动驾驶长尾场景中的应用潜力
(2)参与自动驾驶场景下的真实多模态数据(图像、视频、激光雷达、文本描述)的清洗、标注与特征提取,构建适配视觉语言模型的高质量训练数据集。
2、VLM算法开发与调优
(1)基于真实驾驶数据针对自动驾驶感知任务进行多模态数据利用方式及训练方法的探索,解决使用VLM业务场景落地方面的技术及工程问题
(2)开发多模态数据融合策略,研究时序视频数据、空间信息以及文本语义的联合建模方法
任职要求:
1、教育背景:计算机科学、电子工程、应用数学、人工智能等相关专业硕士/博士在读,具备扎实的深度学习基础
2、技术能力
(1)熟练使用Python,掌握PyTorch/TensorFlow框架,精通深度学习、机器学习、计算机视觉、自然语言处理的基本知识
(2)熟悉常用多模态模型架构,理解Transformer、扩散模型的核心原理,了解大模型预训练算法
(3)具有良好的编程习惯及分析解决问题的能力
加分项
1、善于运用AI工具提效,分析和处理问题
2、有自动驾驶数据集处理经验,或参与过VLM和LLM预训练和分布式训练实际项目经验
3、在CVPR/ICCV/ECCV/NeurIPS等顶会发表多模态相关论文,或开源社区活跃贡献者