一、团队介绍
高德视觉技术中心为高德业务提供全面的核心视觉技术,是高德时空互联网领域重要的技术驱动力。我们专注于图像识别、点云识别、三维重建和传感器融合定位等领域, 我们致力于研究和开发业内领先的感知、SLAM、重建和多模态大模型等算法, 促科技创新,与生态共进,连接真实世界,做好一张活地图,让出行和生活更美好!
通过视觉技术中心的春季实习生项目,高校学生通过此项目可以接触到高德真实的业务场景和海量时空大数据,在优秀的前辈与高德技术人交流学习中加速成长。我们希望更多优秀的高校同学加入我们,一起打造极致的算法和产品体验。
二、基本要求
面向预期于26、27届毕业的同学,可以连续实习至少三个月的同学优先。实习地点:北京,我们将提供有竞争力的实习薪酬和充足的训练资源。
三、算法实习生
职位描述
团队主要聚焦视觉和多模态大模型技术,我们期待你的工作将覆盖以下至少一个技术方向:
探索多模态大模型的创新研发,掌握多模态大模型的链路设计,数据体系、算法调优、评估迭代的方法。共同探索推理大模型的智能上限,激发VLM的reasoning能力。
探索多模态大模型在下游任务中的技术能力,包括但不限于图文对齐/识别、跨模态理解生成、多模态检索、VLM端到端自动驾驶、世界模型等;
了解大模型模型的训练/微调/推理加速方法,包括但不限于模型结构调优、训练效率提升、高效低成本微调、Muti-token推理,模型部署加速等;
四、职位要求
自然语言处理、计算机视觉、人工智能等相关专业的硕士生/博士生,对发文章有兴趣,具备良好的英文写作能力;
发表过CV&AI顶会论文优先,ACM编程竞赛、数据建模竞赛等竞赛获奖优先。
动手实现能力强,代码基本功扎实,精通基于Python的算法开发;熟练掌握pytorch/tensorflow/mxnet等至少一项深度学习框架。
自驱力强、充满好奇心、团队合作、沟通能力佳。