职位要求
岗位职责
1. 负责平台稳定保障工作与开发团队合作保障产品迭代生命周期内系统稳定可靠通过监控分析和处理故障优化系统架构流程和计算资源管理等手段确保系统的高可靠性和稳定性
2. 负责运维能力SRE体系建设标准化平台化自动化的运维包括不限于监控告警应急处理资源管理容量管理安全控制等自驱研究行业前沿应用技术.
3. 紧急响应快速处理系统问题故障参与危机处理高效协作解决灾难性问题容灾建设和规划落实规演练客户活动重保护航
任职资格
1. 本科及以上学历;互联网系统运维和SRE体系建设相关经验
2. 具备一种以上语言编程能力go/python/jave/shell有系统化解决问题思维有较好的业务架构能力能理解高可用高并发架构有平台项目建设主导经验优先
3. 熟悉一家以上公有云产品服务腾讯云/字节云/华为云/阿里云/AWS熟悉常见云服务容器技术有应用维护经验
4. 有丰富的系统运维经验对常见系统故障隐患有系统性总结和实际处理经验有客户重保护航经验优先
5. 有成熟的逻辑分析能力沟通技巧优秀的事项推动能力
6. 有自驱力责任心强抗压能力强耐心细心