岗位职责: 1、参与爬虫系统的架构设计与开发; 2、负责网页信息抽取、数据清洗等研发和优化工作; 3、负责大规模文本、图像、视频数据的抓取、抽取,去重、分类,垃圾过滤,质量识别等工作; 4、参与爬虫核心算法的策略优化研究,提升网页抓取的效率和质量。
职位要求: 1、全日制本科以以上学历,计算机相关专业,可长期实习者优先;
2、工作认真细致踏实,学习能力强,以解决技术难题为乐趣,有想法,敢于挑战; 3、熟悉MySQL,熟悉linux平台开发,掌握Python/C++/Java三种编程语言中的至少一种; 4、有网络爬虫、网页去重、网页信息抽取等相关经验者优先。
当前职位已下线
为你揭秘各职业的工作内容|薪资水平…
使用python技术从事产品服务开发设计、爬虫服务、数据分析等业务的人员。