岗位职责:
1、参与OCR数据系统的设计和开发,提供海量图像数据的接入、处理、存储、检索和分析能力;
2、根据产品和项目需求,参与集群搭建调优、应用系统开发、视觉算法的封装和计算并行化、性能优化等工作;
3、基于大数据技术进行多元化的数据分析,对海量OCR图像进行结构化转存,结合业务运营数据进行数据清洗、处理、统计分析等工作;
任职要求:
1、本科或以上学历,计算机或数学相关专业;
2、熟练掌握Java,至少一门其他编程语言(包括但不限于Scala/Ruby等),算法和数据结构基础扎实,具有良好代码风格和质量意识;
3、具备良好的计算机体系结构基础,理解分布式架构和分布式系统原理,熟悉常用技术栈(如Hadoop、Spark、Flink、Kafka、Fluentd等);
4、满足以下条件者优先考虑:
a. 了解Ruby,有ROR开发经验
b. 熟悉虚拟化技术,有Docker环境下应用开发及集群部署调试经验,熟悉主流的集群部署工具;
c. 了解GPU并行计算,熟悉CUDA编程;
d. 熟悉多进程、多线程和网络编程,有高并发系统的开发和性能优化经验;
e. 具有大数据日志采集、ETL、海量数据处理等相关实习/工作经验;
5、学习能力强,具备的分析和解决问题能力,具备良好的沟通能力和团队合作意识;