创新工场爬虫实习生
2022-09-30 23:02:18 刷新
200-250/天 深圳 本科 4天/周 实习4个月
优质团队
微信扫码同步查看
投递方便通知及时
扫码手机查看
当前职位已下线
职位描述:

职责描述:

1. 负责网络爬虫采集规则的编写;

2. 设计爬虫策略和防屏蔽规则,提升网页抓取的效率和质量;

3. 各类互联网数据的采集抓取;

4. 部分数据分析数据统计相关工作;

 

任职要求:

1)熟悉Python 或者 Java,熟悉常用爬虫框架中的一种或多种,如Scrapypyspider等;

2. 熟悉HTML/JavaScript/CSS/xpath/url/Ajax/xmlweb技能知识,熟悉requestsWebDriverphantomjscurl等工具;

3. 熟悉Linux系统,熟悉MySQLRedisNoSQL等,熟悉Internet基本协议(如TCP/IPHTTP等);

4. 能够解决封账号、封IP采集等问题,解决网页抓取、信息抽取等问题,构建完善的网络信息收集平台;

5. 熟悉常用的数据结构和算法。

6. 熟悉常用SQL语句的编写。

7. 有数据挖掘,自然语言处理(NLP)经验优先
投递要求:
简历要求: 中文
截止日期:2020-07-15
工作地点:
深圳市南山区粤海街道科园路软件产业基地4B栋-204室(创新工场) 公交建议:地铁2号线科苑站或后海站(出地铁口需走10分钟左右);公交站软件产业基地或滨海之窗 收起地图
求职中若出现虚假宣传,收取财物等违法情况。请立即举报

当前职位已下线

公司简介

职位百科

为你揭秘各职业的工作内容|薪资水平…

数据挖掘师

百科详情

运用机器学习技术处理海量数据,发现富有价值的业务信息的工程技术专业人员。