云智能基础产品事业部-高可用架构师-稳定性-杭州/北京/深圳
阿里巴巴集团
北京
1天前

部门介绍

基础产品事业部是阿里云智能事业群的核心产品研发部门 负责云计算IaaS基础设施计算 存储 网络 安全 中间件 系统软件 容器等产品研发 是阿里 蚂蚁集团业务和百万以上企业客户重度依赖的云计算基础设施

稳定性团队核心目标是体系化建设基础产品的稳定性保障体系

1. 体系化的产品研发质量保障流程 建立高标准的产品SLA 高测试用例覆盖率 丰富的使用场景测试 稳定的极限性能测试

2. 一体化的变更管控监测质量建设保障 变更审批 变更白屏化 灰度环境验证 分批分区域发布 变更过程中核心指标监控自动化对比验证 秒级发现问题与报警阻断 有效控制变更过程中的产品质量

3.线上运行环境 容量水位规划 常态化红蓝攻防 故障演练 一方面在线上发现稳定性隐患 另外一方面提升团队的应急响应处理能力 监控报警体系化 从IDC 云基础产品 流量入口 客户视角等体系化监控 保证线上问题第一时间发现与定位

4.完善的线上故障应急响应与处理流程

5.稳定性机制与文化建设

岗位职责

1.负责云基础设施产品的高可用架构演进设计与实现 包括云平台全局架构 单元化架构 云基础产品业务管控平面容灾架构 云基础产品数据平面架构

2.梳理云基础设施平台和云产品架构 识别可用性风险 建设演练环境与工具平台 发现稳定性隐患并持续修复改进

3.建立可持续跟踪的云产品SLA体系 建立对外对客户的承诺 对内互相的合作基础

4.负责高可用通用核心基础组件如QoS等在高并发 海量请求数下的高处理性能

5.沉淀高可用最佳实践 参与云产品高可用架构设计与评审 用技术手段和方法进行有效指导与验收

岗位要求

1.5年以上工作经验 至少3年以上大型分布式系统架构及开发经验

2.有大规模分布式服务开发经验 具有高性能 高可用服务开发经验 掌握网络传输 存储 虚拟化 缓存 消息队列 限流等技术

3.具备较好的高可用体系化知识与能力 包括开发设计 研发过程 变更管控 监控熔断 应急快恢等方面

4.优秀的分析和解决问题能力 较强的抗压能力

申请
添加至收藏
从收藏夹中删除
申请
邮箱地址
通过点击 "继续", 我 同意neuvoo处理我的信息数据, 并给我发送电子邮件提醒 详见neuvoo 隐私政策 。我可以在任何时候取消订阅。
继续
申请表