岗位职责(具体工作内容)
岗位详情:
1、负责最新LLm大模型应用落地微调、文本及其他模态融合、交通场景微调;开发和迭代开放交通场景下多模态大模型,提升用户乘车和驾驶体验;
2、跟进业内前言大模型应用技术,探索相关语言大模型创新技术方案与落地场景;
3、负责开发滴滴百万级别实时海量采集图像的视觉内容的理解算法,主要涉及的技术内容包括但不限于多模态语义理解、图像/视频的语义分割、生成式大模型等技术
4、有顶刊顶会经验优先,硕博优先,有大模型微调和训练经验优先,有顶会顶刊发表者优先,该实习生岗位需要有paper和专利产出。
技能要求:
1、在多模态领域有深入研究经历与实践;对大模型微调技术有不错的成果与尝试;
2、对大模型(deepseek, Qwen)有深入了解和实践经验;
关于我们:
滴滴出行时空数据挖掘&视觉计算组,关注多模态交通场景下动态事件发现及路网生成,我们和实习生一起探索、成长。团队多项相关工作被kdd,icde,tkde、cvpr等国际顶级会议期刊收录,实习生能够在实习期间获得资深多模态技术专家指导,算法经过验证后可以在实际业务场景中进行广泛应用,期待优秀的你加入我们!
任职资格(学历、目标院校、语言、技能、性格等要求)
1、在多模态领域有深入研究经历与实践;对大模型微调技术有不错的成果与尝试;
2、对大模型(deepseek, Qwen)有深入了解和实践经验;