Python爬虫实习生（AIGC数据方向）实习招聘-英大长安咨询实习生招聘-实习僧

Python爬虫实习生（AIGC数据方向）

2025-12-17 11:24:08 刷新

100/天成都本科 5天／周实习3个月

一对一导师接受大一大二地铁周边

微信扫码同步查看
投递方便通知及时

扫码手机查看

投个简历

职位描述：

【岗位职责】
核心数据采集： 负责公司AIGC业务所需的多模态数据（文本、文档、图像等）的爬虫开发与采集工作；
攻克爬虫难题： 应对各类反爬策略（如IP限制、验证码、JS逆向等），设计高效、稳定的分布式爬虫策略；
数据清洗与入库： 负责对采集的数据进行清洗、去重、格式转换（如PDF转Markdown），为大模型训练提供高质量的语料支持；
自动化流程： 维护和优化数据采集流水线，监控爬虫系统的运行状态，确保数据更新的及时性和完整性；
业务协作： 配合算法团队，协助完成部分基于大模型（LLM）的数据标注或简单应用层开发（如AI Agent的数据接口对接）。

【岗位要求】
本科及以上学历，计算机、软件工程等相关专业；
精通Python编程，熟练掌握多线程/多进程编程，代码风格规范；
熟练掌握主流爬虫框架（如Scrapy、Selenium、Playwright、Pyppeteer等），深刻理解HTTP/HTTPS协议；
具备反爬对抗经验，了解常见的反爬机制（Cookie池、代理IP池、JS逆向分析等）；
熟悉MySQL、Redis、MongoDB等主流数据库的使用；
加分项： 对AIGC/大模型有浓厚兴趣，了解LangChain或有数据清洗（ETL）经验者优先。

投递要求：

简历要求：中文

截止日期：2026-09-17

工作地点：

四川省/成都/武侯区英大长安保险经纪四川分公司

求职中若出现虚假宣传，收取财物等违法情况。请立即举报

投个简历

公司简介

英大长安咨询

职位百科

为你揭秘各职业的工作内容｜薪资水平…

Python 工程师

百科详情

使用python技术从事产品服务开发设计、爬虫服务、数据分析等业务的人员。