岗位职责:
-平台功能开发与优化
-参与RDS管控平台的资源调度、任务编排、高可用架构设计等模块的开发,协助实现数据库集群的自动化管理
-编写脚本或工具,优化数据库实例的部署、扩容、备份恢复等流程,提升运维效率
-协助开发监控告警模块,实现数据库性能指标(如CPU、内存、磁盘IO)的实时采集与异常预警
-云原生与分布式技术实践
-学习并参与云原生数据库的容灾设计(如同城/异地容灾、全球数据库集群),支持高并发场景下的稳定性保障
-探索容器化(如Kubernetes)在数据库管控中的应用,优化资源利用率和部署效率
-日常运维与监控
-负责RDS实例的日常巡检,包括数据库运行状态、存储空间、网络流量等指标的监控,及时处理告警
-协助处理数据库故障(如连接异常、性能瓶颈),配合研发团队定位问题并优化解决方案
-备份与恢复管理
-制定并执行数据库备份策略,定期验证备份文件的完整性和可恢复性,确保数据安全
-参与灾备演练,优化容灾切换流程,降低业务中断风险
-知识库与协作
-编写运维操作手册、故障处理指南等技术wiki,沉淀运维经验
-协助测试团队进行系统集成测试,提供运维视角的反馈,优化产品易用性
任职要求:
-掌握至少一门编程语言(Python/Java优先),具备脚本开发能力,能独立完成自动化工具的编写
-熟悉Linux系统操作,能编写Shell脚本处理日志分析、服务监控等任务
-了解MySQL/PostgreSQL等关系型数据库的基本原理,熟悉SQL语句及常见运维操作(如备份、恢复、权限管理)
-熟悉Redis、Kafka等中间件的安装配置及日常维护
-熟悉阿里云/AWS等云平台的基础服务(如RDS、EC2),了解云原生技术栈(如Docker、Kubernetes)
-掌握Ansible、Prometheus等自动化运维工具的使用
-具备快速学习能力,能通过文档或代码理解复杂系统架构,并主动探索优化方案
-对数据库性能调优、故障排查有强烈兴趣,善于分析日志和监控数据定位问题
-沟通表达清晰,能高效与开发、测试团队协作,推动问题闭环
-责任心强,能承担7×24小时值班支持,保障系统稳定性
-学历与专业:计算机相关专业本科或硕士在读,2027届毕业生优先
-实习周期:至少3个月,每周出勤4天以上