爬虫数据采集工程师实习招聘-RoboScience实习生招聘-实习僧

爬虫数据采集工程师

2025-12-08 17:50:24 刷新

300-500/天深圳本科 5天／周实习3个月

周末双休

微信扫码同步查看
投递方便通知及时

扫码手机查看

投个简历

职位描述：

岗位职责：
结合大模型训练需求，负责设计、开发和维护面向视频/社交平台的互联网数据（视频、文本数据）采集系统。
针对大模型数据预处理要求，优化爬虫数据格式和质量，制定相应的数据抓取、解析与清洗策略。
结合大模型场景，构建半自动/自动化定向抓取能力，推进数据抓取工作平台化建设。
职位要求：
本科及以上学历，计算机科学、人工智能、网络安全等相关专业。
有爬虫开发及逆向工程经验，有大模型或AI相关领域的爬虫应用经验者优先。
熟悉并能绕过常见的反爬技术（如动态网页加载、验证码、JS加密等）。
精通Python或其他编程语言，熟悉爬虫框架（如Scrapy、Selenium、Playwright等）。
熟悉大模型训练和数据处理流程，能够根据模型需求调整数据抓取策略。
熟悉常见网络协议（HTTP/HTTPS）和接口抓取，能够对复杂数据进行高效提取和清洗。
加分项：
有大规模数据抓取与处理经验，尤其是针对大模型训练数据的采集和优化。
熟悉数据加密与解密技术，能够破解复杂的加密算法。
具备AI或大模型领域的技术背景，能够理解和支持模型数据需求。

投递要求：

简历要求：中文

截止日期：2026-01-10

工作地点：

广东省/深圳市/宝安区深圳市蘅芳科技大厦

求职中若出现虚假宣传，收取财物等违法情况。请立即举报

投个简历

公司简介