小天管理 发表于 2024年9月24日 发表于 2024年9月24日 职位描述1 、分析和识别云服务的稳定性与高可用的薄弱点,发掘并抽象故障场景,给出解决方案并推进落地与验证;2 、参与系统性梳理公有云核心系统和设施的容灾技术方案,推动和参与核心服务的容灾能力建设;3 、组织大规模线上压测、故障演练、预案演习,使系统能有效治理风险和快速故障应急;4 、建设蓝军能力,负责演练验收能力与工具平台建设,数据化驱动系统容灾容错能力的持续优化。职位要求1 、熟悉云基础产品服务架构,有 VPC 、NAT 、负载均衡等云网络产品研发经验者优先;2 、熟悉公有云基础设施领域设计架构,有网络领域的架构设计、问题分析和处理经验者优先;3 、对业务和基础设施高可用建设,容灾演练有丰富的实战经验;4 、自驱,具备良好的沟通协调能力,逻辑性强,善于团队合作;欢迎投递简历到 yuliang.666@bytedance.com
已推荐帖子