高级运维工程师( C 端方向)
1 、系统稳定性保障:负责 App 生产环境的日常运维、监控、故障排查与应急响应,确保服务 SLA 达到 99.9%以上。 2 、云平台与基础设施管理:管理和优化在公有云上的服务架构,包括但不限于计算、网络、存储及数据库等核心服务。 3 、CI/CD 与容器化:设计、维护和优化基于 Kubernetes 的容器化部署平台,完善前后端 CI/CD 流水线,实现快速、安全、自动化的应用交付
加载中...
负责核心系统的架构设计与部署实施,提出优化方案与性能评估。
负责搭建系统监控平台,对核心系统的应用性能、可用性进行监控。
负责系统安全的运维工作,724 小时响应处理各类系统问题。
负责公司在 AWS 云平台上的服务架构设计、部署和维护,确保系统的高可用性和伸缩性。
优化 AWS 资源使用,降低成本,提高资源利用率。制定和实施 AWS 云服务的安全策略和合规性要求。
持续关注 AWS 云服务的新技术和最佳实践,推动服务架构的持续改进和创新。
计算机相关专业,本科及以上学历,5年以上运维经验。
熟悉 Prometheus 等监控系统。熟悉 JVM 工作原理,熟悉 Java 框架 Spring Cloud 架构。
熟悉 ELK 日志系统,有过海量日志收集和分析经验优先。
熟悉 Docker、Kubernetes 容器技术,有生产使用经验优先。
理解 AWS 云服务架构,包括但不限于 EC2、RDS、MSK、ELB、VPC、S3 等。
有使用 AWS 云服务进行系统部署、监控、优化和维护的实际经验。
熟悉 AWS 云服务的计费模式和成本优化策略。
了解 AWS 云服务安全最佳实践,包括身份和访问管理(IAM)、安全组、网络 ACL 等。
有 Python 或 Go 开发经验者优先。
具有 AWS 云服务认证(如 AWS Certified Solutions Architect Associate 或更高)优先。
需要 base 在新加坡。会说华语。
薪酬福利:$3000 - $5000 / month
XT
A global blockchain ecosystem and cryptocurrency exchange.
注册并登录后即可查看
1 、系统稳定性保障:负责 App 生产环境的日常运维、监控、故障排查与应急响应,确保服务 SLA 达到 99.9%以上。 2 、云平台与基础设施管理:管理和优化在公有云上的服务架构,包括但不限于计算、网络、存储及数据库等核心服务。 3 、CI/CD 与容器化:设计、维护和优化基于 Kubernetes 的容器化部署平台,完善前后端 CI/CD 流水线,实现快速、安全、自动化的应用交付
1.负责公司底层基础架构(云原生、中间件、OS 、网络、存储、服务治理)的稳定性架构设计、高可用方案落地与风险治理。 2.构建全链路压测、混沌工程、容量规划、故障自愈体系,主动发现并解决架构单点、性能瓶颈、级联故障风险。 3.牵头核心系统重大故障应急处置、疑难问题根因定位与复盘整改,建立全生命周期稳定性保障机制。 4.设计 SLA/SLO/SLI 指标体系,搭建监控告警
负责 Kubernetes 集群的日常运维、监控及优化,保障集群的高可用性与稳定性; 及时响应并处理线上故障,快速定位问题并恢复业务,确保服务的连续性; 参与业务系统的部署、上线、变更及容量评估,制定并演练应急预案; 持续优化运维流程与工具链,提升运维自动化水平。 熟悉 Python/Shell/Golang 等至少一种编程语言,具备实际项目开发经验; 具
负责拼多多容器平台的工程和产品化建设,构建业内一流的超大规模资源管理和调度系统,解决业务和集群规模增长带来的可用性、稳定性以及性能问题; 服务于公司内部多种业务,提供针对不同计算场景的通用框架和解决方案; 以数据驱动的方式,通过技术手段提升资源调度效率、提高集群和节点的资源利用率; 负责容器平台相关新技术的架构演进,包括但不限于在离线混布、容量托管、安全容器、Serverl