创新工场爬虫实习生实习招聘-创新工场实习生招聘-实习僧

创新工场爬虫实习生

2022-09-30 23:02:18 刷新

200-250/天深圳本科 4天／周实习4个月

优质团队

微信扫码同步查看
投递方便通知及时

扫码手机查看

当前职位已下线

职位描述：

职责描述：

1. 负责网络爬虫采集规则的编写；

2. 设计爬虫策略和防屏蔽规则，提升网页抓取的效率和质量；

3. 各类互联网数据的采集抓取；

4. 部分数据分析数据统计相关工作；

任职要求：

1）熟悉Python 或者 Java，熟悉常用爬虫框架中的一种或多种，如Scrapy，pyspider等；

2. 熟悉HTML/JavaScript/CSS/xpath/url/Ajax/xml等web技能知识，熟悉requests、WebDriver、phantomjs、curl等工具；

3. 熟悉Linux系统，熟悉MySQL、Redis、NoSQL等，熟悉Internet基本协议（如TCP/IP、HTTP等）；

4. 能够解决封账号、封IP采集等问题，解决网页抓取、信息抽取等问题，构建完善的网络信息收集平台；

5. 熟悉常用的数据结构和算法。

6. 熟悉常用SQL语句的编写。

7. 有数据挖掘，自然语言处理(NLP)经验优先

投递要求：

简历要求：中文

截止日期：2020-07-15

工作地点：

深圳市南山区粤海街道科园路软件产业基地4B栋-204室（创新工场）公交建议：地铁2号线科苑站或后海站（出地铁口需走10分钟左右）；公交站软件产业基地或滨海之窗收起地图

求职中若出现虚假宣传，收取财物等违法情况。请立即举报

当前职位已下线

公司简介

为你揭秘各职业的工作内容｜薪资水平…

百科详情

运用机器学习技术处理海量数据，发现富有价值的业务信息的工程技术专业人员。