岗位描述
1、负责公司海量服务和平台的高可用、高可靠保障和优化,通过DevOps/AIOps平台和工具建设,实现极致高效稳定的持续部署、容量管理、监控定位、故障恢复,用专业技术和优质服务提升产品体验;
2、负责业务在公司基础设施及公有云上的规划及构建【包含但不限于云厂商选型、机房节点(云区域)选址、程序资源适配等】,通过平台工程和工具研发能力,打造面向全球的低成本、高可靠、优体验的运营基础环境。
3、负责公司百亿规模运营资源管理,引领公司业务资源与基础架构的合理使用及前瞻规划,覆盖计算、存储、CDN加速、网络、数据库、PaaS平台等,持续提升资源管理效率和降低运营成本;
4、负责业务的稳定性保障,玩家体验优化,发布变更,故障处理,提升故障快速恢复的手段和能力,提供持续优化稳定性架构方案等;
5、负责业务容灾架构的设计和落地,容量管理,资源筹备等;
6、负责与研发团队协作解决研发过程问题,提升研发效率,提供稳定高效的研发保障服务;
7、负责CI、CD、CO等领域PaaS平台和SaaS工具的设计与研发;
8、负责CI、CD、CO等领域的平台SRE工作,包括高可用架构设计优化、可靠性保障等。
岗位要求
1、熟悉计算机网络、体系架构、计算机原理、Linux/Windows操作系统及常用命令;
2、至少掌握一门编程语言,例如Python/Java/GO/Shell等,有良好的编码规范;
3、具备出色的数据分析和深度思考能力,不畏困难推进问题解决;
4、责任心强、能抗压,具备良好的用户意识、沟通能力和团队协作能力;
5、乐于尝试新技术和学习新知识,爱钻研、乐实践、愿分享。