岗位职责
1、负责网络爬虫的架构设计、开发与优化
2、负责抓取数据的清洗、落地、分析
3、抓取策略算法的更新维护,以及确保数据抽取准确、高效
任职要求
1、统招全日制211本科及以上学历,有过互联网或软件行业项目经验
2、理解 HTTP 协议,熟悉 HTML、DOM、XPath
3、熟悉 Linux 开发环境,至少熟悉 Python/Java中的一种编程语言
4、有爬虫、信息抽取、文本分类、大数据处理相关经验优先
5、有自然语言处理、机器学习经验优先
6、熟悉浏览器内核、渲染机制优先
7、工作认真,细心,有条理,积极性高;良好的沟通能力及团队合作精神
当前职位已下线
为你揭秘各职业的工作内容|薪资水平…
运用机器学习技术处理海量数据,发现富有价值的业务信息的工程技术专业人员。