系统运维
1、围绕公司app,小程序,web商城等业务稳定性,建立完善的监控预警体系及事
件处理机制;
2、制定安全生产规范,帮助团队执行业务评审与安全
生产实施;
3、支持公司业务快速迭代,包括部署、发布、变更
等;
4、推动自动化工具,可观测平台,容灾架构,高可用
架构持续迭代保障业务连续性;
6、推进风险巡检,混沌工程持续迭代,将风险扼杀在
摇篮中;
7、运维保障团队梯队建设;
职位要求:
1、本科以上学历,具有大型互联网公司3年以上运维经
验;
2、精通Linux系统管理,熟练使用shell、python、go
等至少一门语言;
3、熟练掌握常见监控软件如prometheus、zabbix、Open-Falcon等;对APM监控体系有一定的理解;4、具有运维自动化工具体系建设经验;
5、责任心强、具有良好沟通能力及团队精神;
6、带过5人以上运维团队;
7、有千万日订单分布式系统稳定性保障经验优先;
拉勾安全提示