数据信息挖掘实习生
2026-02-05 15:52:46 刷新
150-200/天 北京 不限 5天/周 实习5个月
留学生实习零基础实习接受大一大二地铁周边餐补一对一导师周末双休
微信扫码同步查看
投递方便通知及时
扫码手机查看
投个简历
职位描述:
1、岗位核心:基于 AI 智能体工具挖掘立项拟建、规划公示类站源,完成站源分类、数据采集与基础整理,支撑 AI 智能体工具的站源库建设,并对AI智能体提出修改策略。 2、核心岗位职责 ①站源精准挖掘:依托 AI 智能体工具,定向挖掘全国各省市【立项拟建、规划公示】类站源,主动探索各类网站栏目、隐藏入口,完成站源信息的收录与核验; ②敏感站源快速分类:对接站源敏感判定标准,对挖掘到的站源进行快速类型识别、敏感度分级,做好标注与记录,确保站源分类精准; ③八爪鱼数据采集实操:独立使用八爪鱼采集器完成站源数据的采集规则配置、爬取任务执行,及时排查采集过程中的反爬、数据缺失、格式异常等问题,保障采集数据的完整性与有效性; ④站源与数据管理:对挖掘的站源信息(网址、栏目、类型、敏感度、采集状态等)进行系统化整理、归档,维护站源库的更新与清洁; ⑤辅助工具迭代:反馈 AI 智能体工具在站源挖掘中的使用问题,提出基础优化建设性建议,辅助工具功能迭代。 3、任职要求 ①在校大学生,专业不限(计算机、数据科学、信息管理等相关专业优先),能保证稳定的实习时长; ②具备AI 智能体工具基础使用经验,可快速上手站源挖掘相关的智能体操作流程; ③能快速理解站源敏感判定规则,实现敏感站源的精准、高效分类,对信息的甄别与判断能力较强; ④心思缜密、耐心细致,擅长探索各类网站的栏目结构、隐藏资源,具备主动的站源挖掘意识; ⑤熟练使用八爪鱼数据采集器,能独立完成采集规则编写、反爬应对、数据清洗等操作,有实际数据采集项目经验者优先; ⑥具备基础的电脑操作与文档处理能力(Excel/Sheet),能对站源与采集数据进行规范化整理; ⑦学习能力强、责任心强,能及时响应工作需求,具备良好的沟通与反馈意识。
投递要求:
简历要求: 中文
截止日期:2026-04-09
工作地点:
北京市/北京市/海淀区 北京市海淀区广联达二期大厦
求职中若出现虚假宣传,收取财物等违法情况。请立即举报
投个简历
公司简介

职位百科

为你揭秘各职业的工作内容|薪资水平…

数据挖掘师

百科详情

运用机器学习技术处理海量数据,发现富有价值的业务信息的工程技术专业人员。