【实习】【今日头条】数据抓取实习生
职位描述:
1、目标是从互联网海量信息中抓取并筛选出有价值的内容,并转换为适合移动端展示的格式以推荐给用户,涉及到的环节包括爬虫,抽取,去重,质量识别等;
2、主要工作集中在爬虫和抽取环节;
3、由于需要覆盖大量长尾数据,对内容的抽取涉及到非常多的挑战;
4、帮助头条覆盖更多的内容,并将内容以更加精准的形式展现给用户。
职位要求:
1、对技术有热情, 既有高远目标,也能脚踏实地
2、有扎实的数据结构和算法功底, 强悍的编码能力
3、熟悉linux开发环境,熟悉C++和python语言的优先
4、理解http,熟悉html、DOM、xpath优先
5、每周出勤至少4天,实习期至少保证6个月,出勤多以及可长期实习者优先。
【工作福利】:
弹性工作;超丰盛免费三餐&下午茶、租房补贴、免费健身房;扁平管理、淡化层级;团队氛围好,不定期TB……
【工作地点】:
北京市海淀区北三环西路43号 中航广场1号楼 今日头条
当前职位已下线
为你揭秘各职业的工作内容|薪资水平…
负责计算机产品的服务器端研发,通过代码、API 和数据库集成构建服务端架构,提高网站、应用程序或软件的运行效率,为前端提供支持的专业技术人员。