1、岗位核心:基于 AI 智能体工具挖掘立项拟建、规划公示类站源,完成站源分类、数据采集与基础整理,支撑 AI 智能体工具的站源库建设,并对AI智能体提出修改策略。
2、核心岗位职责
①站源精准挖掘:依托 AI 智能体工具,定向挖掘全国各省市【立项拟建、规划公示】类站源,主动探索各类网站栏目、隐藏入口,完成站源信息的收录与核验;
②敏感站源快速分类:对接站源敏感判定标准,对挖掘到的站源进行快速类型识别、敏感度分级,做好标注与记录,确保站源分类精准;
③八爪鱼数据采集实操:独立使用八爪鱼采集器完成站源数据的采集规则配置、爬取任务执行,及时排查采集过程中的反爬、数据缺失、格式异常等问题,保障采集数据的完整性与有效性;
④站源与数据管理:对挖掘的站源信息(网址、栏目、类型、敏感度、采集状态等)进行系统化整理、归档,维护站源库的更新与清洁;
⑤辅助工具迭代:反馈 AI 智能体工具在站源挖掘中的使用问题,提出基础优化建设性建议,辅助工具功能迭代。
3、任职要求
①在校大学生,专业不限(计算机、数据科学、信息管理等相关专业优先),能保证稳定的实习时长;
②具备AI 智能体工具基础使用经验,可快速上手站源挖掘相关的智能体操作流程;
③能快速理解站源敏感判定规则,实现敏感站源的精准、高效分类,对信息的甄别与判断能力较强;
④心思缜密、耐心细致,擅长探索各类网站的栏目结构、隐藏资源,具备主动的站源挖掘意识;
⑤熟练使用八爪鱼数据采集器,能独立完成采集规则编写、反爬应对、数据清洗等操作,有实际数据采集项目经验者优先;
⑥具备基础的电脑操作与文档处理能力(Excel/Sheet),能对站源与采集数据进行规范化整理;
⑦学习能力强、责任心强,能及时响应工作需求,具备良好的沟通与反馈意识。