实习周期:至少3个月,每周实习不少于4天
【岗位职责】
1. 参与多模态模型(VLM,Vision-Language Model)在辅助驾驶场景下的数据处理工作;
2. 负责图像与文本数据的标注、清洗与结构化,支持下游训练任务;
3. 设计和验证多模态 prompt,用于模型能力测试与调优;
4. 协助完成数据预处理 pipeline 的脚本开发、优化与维护;
5. 跟进 VLM 模型在真实辅助驾驶数据中的实验表现,支持项目分析与文档整理。
【岗位要求】
- 熟练掌握 Python 编程,具备良好的工程实现能力;
- 了解主流 VLM 模型(如BLIP、MiniGPT、InternVL等)原理及应用,有相关使用经验;
- 熟悉数据处理流程,包括数据标注规范制定、数据清洗、格式转换等;
- 具备良好的逻辑思维与自我驱动能力,善于沟通协作;
- 加分项:
- 有智能辅助驾驶或多摄像头感知项目背景;
- 使用过自驾驶数据集(如Waymo、nuScenes、Apollo等);
- 熟悉常见可视化工具(如Matplotlib、OpenCV)或前端交互工具(如Gradio)。