[上海] 高级SRE工程师
佚
佚名84 阅读
内容
base上海, 要求8年以上SRE、DevOps 或系统运维相关工作经验,需要有2年以上web3工作经验
岗位职责
- 参与建立统一变更流程,确保变更可灰度、可监控、可回滚,保障线上变更安全可控。
- 开发并维护自动化部署、环境管理、监控工具;优化 CI/CD 流程,提高交付效率与稳定性。
- 基于业务需求进行容量评估与扩缩容设计;管理并优化云资源(如 AWS、阿里云),保障业务 7x24h 稳定运行。
- 熟悉系统架构,快速定位网络、权限、服务异常、部署等问题;制定并执行故障排查 SOP,推动问题及时恢复。
- 主动发现系统风险,推动监控、告警、架构优化、演练等稳定性治理工作;构建可观测性体系,提高问题发现能力。
- 参与日常 OnCall,快速响应及处理各类线上问题。
岗位要求
- 计算机或相关专业,本科及以上学历。
- 8 年以上 SRE、运维开发、平台工程或相关经验。
- 熟悉 Linux、基础网络与系统排查。
- 熟悉 Shell 脚本编写,至少掌握 Golang、Python、Java 中的一种,能够参与运维平台开发与维护。
- 熟悉云平台(AWS 、阿里云等)、容器和 Kubernetes 基本原理及使用。
- 对监控、日志、告警体系有实战经验(如 Prometheus / Grafana / Loki)。
- 具备快速定位复杂问题的能力,能在高压场景下保持良好判断。
- 有大规模分布式系统、高可用架构或自动化平台建设经验者优先。
- 有 Terraform 等 IaC 工具使用经验者优先
联系方式
VX:Bellafafa_
TG:@fuseiijiang