数据爬虫实习生-广州
【工作内容】
- 负责指定的网站进行页面抓取、数据清理提取;
- 参与已有爬虫系统中作业的检验,设计和优化爬虫策略,充分利用已有服务器和宽带资源进行优化;
- 针对APP数据进行抓包分析,爬取APP数据并整合存储;
- 对大规模数据进行处理和简单分析。
【职位要求】
- 本科及以上学历,计算机相关专业;
- 掌握Python等编程语言,了解多线程、多进程、网络通信等编程相关知识;
- 掌握网页抓取原理,了解TCP/HTTP协议、Html/Js/Css、Ajax等技术,熟悉一般的网站登陆原理;
- 具有实际爬虫开发工作经验,熟悉常见爬虫框架和工具,比如pyspider, scrapy和Selenium等;
- 了解爬虫框架原理、有过APP抓包分析经验者优先;
- 具有Hadoop、数据挖掘、自然语言处理等相关经验者优先;
- 能够快速学习和掌握新技术,优秀的分析、解决问题能力,具备团队合作精神。
-面向2021年及以后毕业的在校生,每周至少可以实习3天(连续),至少实习3个月(可保证6个月者优先)
【实习地点】
广州市天河区科韵路网易大厦
【其他信息】
实习补贴:3000元/月,免费三餐+免费班车+健身房