岗位职责(具体工作内容)
1、掌握大模型基本原理,对LLM、多模态大模型有研发落地经验;
2、计算机视觉、机器学习、人工智能等相关专业;
3、在计算机视觉、多模态理解等方面有扎实的研究基础,熟悉主流模型和算法,如CLIP、Transformer、LLM等;
4、具有较强的好奇心、自驱力和算法/模型创新能力;
5、高质量论文发表者优先(如CVPR、AAAI、NIPS、ICCV、ECCV等);
6、精通至少一种语言技术,包括但不限于Python、C/C++等。
任职资格(学历、目标院校、语言、技能、性格等要求)
1、有视觉算法、多模态算法的技术积累和经验,能支持滴滴业务安全需求中的视觉算法相关的研究和开发,包括但不限于OCR、视觉/多模态大模型、通用结构化信息提取:
2、负责跟踪和探索视觉大模型、多模态大模型、通用结构化前沿问题,参与模型的设计、训练、调优及评测工作,并推进视觉大模型、多模态大模型等在业务场景的应用落地。