爬虫数据采集工程师
2025-12-08 17:50:24 刷新
300-500/天 深圳 本科 5天/周 实习3个月
周末双休
微信扫码同步查看
投递方便通知及时
扫码手机查看
投个简历
职位描述:
岗位职责: 1. 结合大模型训练需求,负责设计、开发和维护面向视频/社交平台的互联网数据(视频、文本数据)采集系统。 2. 针对大模型数据预处理要求,优化爬虫数据格式和质量,制定相应的数据抓取、解析与清洗策略。 3. 结合大模型场景,构建半自动/自动化定向抓取能力,推进数据抓取工作平台化建设。 职位要求: 4. 本科及以上学历,计算机科学、人工智能、网络安全等相关专业。 5. 有爬虫开发及逆向工程经验,有大模型或AI相关领域的爬虫应用经验者优先。 6. 熟悉并能绕过常见的反爬技术(如动态网页加载、验证码、JS加密等)。 7. 精通Python或其他编程语言,熟悉爬虫框架(如Scrapy、Selenium、Playwright等)。 8. 熟悉大模型训练和数据处理流程,能够根据模型需求调整数据抓取策略。 9. 熟悉常见网络协议(HTTP/HTTPS)和接口抓取,能够对复杂数据进行高效提取和清洗。 加分项: 10. 有大规模数据抓取与处理经验,尤其是针对大模型训练数据的采集和优化。 11. 熟悉数据加密与解密技术,能够破解复杂的加密算法。 12. 具备AI或大模型领域的技术背景,能够理解和支持模型数据需求。
投递要求:
简历要求: 中文
截止日期:2026-01-10
工作地点:
广东省/深圳市/宝安区 深圳市蘅芳科技大厦
求职中若出现虚假宣传,收取财物等违法情况。请立即举报
投个简历
公司简介

职位百科

为你揭秘各职业的工作内容|薪资水平…

Python 工程师

百科详情

使用python技术从事产品服务开发设计、爬虫服务、数据分析等业务的人员。