岗位职责(具体工作内容)
基于大模型POI数据建设
在出行场景,POI现实位置的数字化表达,是用户出行需求的终点表达。因此POI不仅需要精准的表达地理位置,还要提供丰富、全面的信息供用户参考决策。现实世界每年有接近40%的变化,怎样高效的发现变更、低成本的接入变更,是POI数据建设的最大挑战。
技术挑战:
【多模态数据处理能力】
多模态数据处理&理解是情报挖掘模型的核心能力。从情报挖掘的角度,可以采集到的资料包括图片、定位信息、Wi-Fi、检索词、司乘行为轨迹、互联网信息、品牌官网等多种信息源。各个信息源的数据表达方式差异化明显,模型怎样从海量情报中理解&发现变更信息,并从多方信息源进行佐证,过滤无效&虚假变更信息是情报挖掘模型的核心能力。
【情报自动化处理能力】
基于Agent的情报自动化处理是POI数据建设突破的根基。情报的核实是POI数据建设的最后一环,情报核实的效果直接影响着最终POI的数据质量。传统的做法都是由人工作业来保证核实的正确性的,但是随着出行业务的快速发展,人工作业无法满足快速更新的业务需求。那么如何使用好人工作业反馈、用户使用反馈数据,结合LLM能力建设Agent,高效准确的核实情报、更新POI数据,是POI目前阶段的最大挑战,也是未来突破的根基。
【用户决策信息建设】
通过大模型补充不同场景用户的决策信息需求,是POI数据建设的下一步目标。在出行场景下,用户的决策过程要参考的信息不用,例如同是餐馆的标签,旅游用户倾向网红店、上班用户餐馆倾向聚餐。POI数据建设需要通过大模型,从多个维度补充信息,供用户决策时使用。
任职资格(学历、目标院校、语言、技能、性格等要求)
1、需要有大模型经验
2、对NLP相关算法熟练掌握
3、有论文经验加分、有vibe coding经验加分