岗位职责(具体工作内容)
1、有视觉算法或多模态算法的技术积累和经验,能支持滴滴业务安全需求中的视觉算法相关的研究和开发,包括但不限于OCR、视觉/多模态大模型、通用结构化信息提取:
2、负责跟踪和探索视觉大模型、多模态大模型、通用结构化前沿问题,参与模型的设计、训练、调优及评测工作,并推进视觉大模型、多模态大模型等在业务场景的应用落地。
任职资格(学历、目标院校、语言、技能、性格等要求)
1、计算机视觉、机器学习、人工智能等相关专业;
2、在计算机视觉、多模态理解等方面有扎实的研究基础,熟悉主流模型和算法,如CLIP、Transformer等;
3、具有较强的好奇心、自驱力和算法/模型创新能力;
4、高质量论文发表者优先(如CVPR、AAAI、NIPS、ICCV、ECCV等);
5、精通至少一种语言技术,包括但不限于Python、C/C++等。