职位描述

我们正在寻找一名经验丰富的Site Reliability Engineer (SRE) 加入我们的团队。在这一角色中，您将扩展我们的运营，设计和维护健壮的基础设施，并在我们的云原生环境中应用最佳实践以确保可靠性和效率。职责包括管理跨云平台的Kubernetes集群（包括OpenShift、Amazon EKS、Azure AKS和Google GKE）、实施和管理CI/CD流水线（使用Jenkins、GitHub Actions、Argo CD或GitLab CI/CD）、设计和维护可观测性堆栈（包括Prometheus、Grafana、Loki、OpenTelemetry及相关技术）、优化系统性能并解决生产问题、实施SRE原则（包括服务级别指标（SLIs）和服务级别目标（SLOs））以维护系统可靠性、使用Go或Python等编程语言以及基础设施即代码（IaC）工具如Terraform自动化基础设施和运维任务、应用AI技能如Vibe Coding进行工程任务、AIOps和自动化、理解大型语言模型（LLMs）和AI代理，以及提示工程能力、保持对新兴技术（包括AI、MLOps和边缘计算）的了解、通过技术写作和演讲贡献知识共享。

任职要求

计算机科学、信息科技或相关领域的学士学位。2-5年SRE、平台工程、DevOps工程师经验。对Kubernetes、云原生技术及主要云平台（AWS、Azure、GCP）有深入的专长。熟练掌握Python或Go或Node.js等编程语言。熟悉CI/CD工具和现代部署实践。了解可观测性工具和基础设施即代码。AI技能，包括在Vibe Coding、AIOps和自动化、理解LLMs和AI代理以及提示工程方面的经验。CKA认证（加分！）。出色的解决问题能力和沟通技能。有开源贡献倾向是加分项。

福利待遇

有竞争力的薪酬。优质健康保险及各种健康与健身福利。有机会参与前沿技术。协作和支持性的工作环境。有机会对公司成功产生实质性影响。

公司介绍

动态公司，专注于先进的AI和云原生解决方案。我们鼓励创造力、协作和创新，使团队能够解决复杂挑战并交付卓越成果。加入我们，为一个重视专业成长、运营卓越和技术进步的组织贡献自己的力量。

CloudRaft招聘Site Reliability Engineer(SRE)（副本）印度

职位描述

任职要求

福利待遇

公司介绍

应聘流程

相似职位

AI工程师（男女均可）- LLM应用，RAG及敏捷系统（德语流利）

Adentis Portugal正在招聘数据工程师职位，地点：葡萄牙 | LinkedIn

GlobalLogic招聘Middle GCP DevOps工程师IRC295272在波兰 | LinkedIn

BillingPlatform 招聘 Sr. Site Reliability Engineer 在菲律宾 | LinkedIn