职位描述
1. 参与构建和维护业界领先的Unified Data AI平台,通过Unified Data AI平台支撑所有的数据使用、数据分析、机器学习需求。
2. 配合算法、数据科学、数值等业务团队,构建和维护直接面向游戏玩家(to C)、实时、支持在线机器学习的数据pipeline;pipeline需满足One source of truth级别的数据一致性,毫秒级的分析查询响应, 4个9的SLA。通过pipeline为业界领先的机器学习算法模型提供训练和推理样本,支撑业务团队通过算法改善用户体验,实现用户增长。
3. 参与数据治理,解决横跨团队的数据质量问题
职位要求
任职要求:
扎实的计算机领域知识,包括且不限于数据结构、算法、操作系统,网络通信原理,编译原理,计算机硬件基础。
2. 熟练使用sql/python/scala/java/go/rust/c++/shell中的一种或多种
3. 熟悉大规模数据计算、存储相关技术。对hadoop生态、spark/flink、kafka/pulsar/amazon kinesis、clickhouse/presto/doris/impala/druid /hive/hbase、snowflake/hologres/adb/databricks/redshift/big query、postgres/citus/greenpulm、aurora/spanner/tidb/cockroach、elasticsearch/mongodb中的一种或多种有较为深入的使用和理解
4. 对建设数据平台/中台,数据仓库、数据建模、指标体系有一定认知,认可高代码质量、高数据质量、自动化一体化的数据系统等发展方向
5. 优秀的学习能力,分析和解决问题的能力
6. 良好的性格、人际交往能力及跨团队协作能力
加分项:
1. 对数据敏感,对机器学习有强烈的兴趣,熟悉常见的数据分析方法,使用机器学习等手段落地过App核心指标归因分析,推荐系统,精准营销等
2. 使用过AWS、MS Azure、GCP等云平台,或熟悉私有部署
3. 具备统计学、数学等相关专业学位
4. 向开源社区提交过高效源代码