岗位职责: 1.负责网页信息的抓取、清洗、存储、更新工作; 2.负责设计和开发分布式网络爬虫系统,包括爬虫调度和状态监控。 任职要求: 1.熟悉基本算法和数据结构,熟悉HTTP协议; 2.熟练使用python语言和Linux开发环境; 3.熟悉MySQL、Redis、Kafka等数据处理工具; 4.熟悉基于正则表达式、XPath、CSS等的网页信息抽取技能 ; 5.有实际爬虫项目开发经验,熟悉常见反爬虫技术的候选人优先。
这份实习你可以获得什么?
1. 该岗位由哈工大博士前腾讯美团算法高级工程师亲带;
2. 一份互联网闭环工作实习经历+一份低成本的创业体验;double kill;
3. 零距离和职场老鸟切磋,汲取经验获得职业起步选择与规划的灵感;
4. 空间大,不设限,足够你挥洒才华,英勇试错;
5. 实习补贴,管饭哦,保证比学校食堂强;
6. 实习结束期待你能成为正式团队成员,如果有需要可以帮你内推其他各大互联网公司。
当前职位已下线
为你揭秘各职业的工作内容|薪资水平…
使用python技术从事产品服务开发设计、爬虫服务、数据分析等业务的人员。