Lendistry正在招聘Cloud Operations Engineer,地点:RAE Macau | LinkedIn
Lendistry是一家平等待遇/积极行动的雇主...
加载中...
技术洞察正在构建其下一阶段的可靠性及AI运维基础——一个以AI为核心的人工智能平台,运行世界上最 demanding 的半导体情报工作流程。我们正在寻找一位高级系统可靠性工程师,负责构建该基础。此职位是高级个体贡献者角色,属于系统可靠性工程团队的技术领导层级。您将负责战略可靠性举措的全程:设定技术方向,定义生产平台的SLO和错误预算,设计AI代理流水线的可靠性模式,以及使开发和AI工程团队能够放心地构建和发布。此职位的特殊之处在于其范围。您不仅仅是在维持系统正常运行——您是在构建一个快速扩展AI平台所需的可观测性、内部开发者平台(IDP)和服务目录。您将作为可靠性声音参与架构决策,作为工程师关闭代理故障模式与平台韧性之间的闭环,以及作为导师构建团队的能力而非个人不可或缺性。如果拥有深入的SRE经验并想将其应用于AI工作负载——代理循环可观测性、 blast radius管理、 LLM基础设施可靠性——这将是该专业知识成为区别点的职位。
要求:- 计算机科学、工程或等同的教育背景;- 6-8年在系统可靠性工程、平台工程或DevOps的逐步经验,具有在高级个体贡献者层级的technical leadership经验;- 深度精通AWS(EKS、Lambda、CloudWatch、AWS Config)和多区域架构模式;- 熟练使用Terraform和GitOps;经验使用策略即代码(Sentinel、OPA/Rego或等价物);- 操作Datadog的实战经验:仪表板、SLO跟踪、警报、日志管理、分布式追踪;- 熟练的容器化经验:Docker、Kubernetes(EKS首选);- 熟练使用Python和/或Bash;具备构建操作工具的经验;对Java和Spring Boot微服务架构有深入理解,足以对EKS托管服务做出可靠性及部署决策;- 熟练设计和优化使用Bitbucket Pipelines和GitHub Actions的CI/CD流水线;- 熟悉IDP工具(Backstage、Atlassian Compass或等价物)是强项;- 具备AI/ML工作负载基础设施、LLM API集成或代理系统运维经验的强项。
福利:- 公司资助的培训和发展机会;- 完整的福利套餐(健康、健身、人寿保险、英语课程);- 灵活的假期政策;- 通过慈善联盟参与社区活动的机会;- 健康资源和支持;- 一个重视多样性、公平性和包容性的包容性环境;- 高成长公司,以高性能驱动;- 预期薪资范围:18,800 - 20,000 PLN
技术洞察是半导体行业的信息平台。被视为半导体创新及相关市场最具行动力的可信信息来源,技术洞察的内容为决策者和依赖准确半导体行业知识的专业人士提供信息。超过650家公司和150,000名用户访问技术洞察平台,这是世界上最大的垂直整合的半导体行业反向工程、拆解和市场分析的集合。该集合包括详细的电路分析、图像、半导体工艺流程、设备拆解、插图、成本和定价信息、预测、市场分析和专家评论。技术洞察的客户包括最成功的技术公司,他们依靠技术洞察的分析来更快、更有信心地做出商业、设计和产品决策。更多信息,请访问www.techinsights.com。
注册并登录后即可查看
Lendistry是一家平等待遇/积极行动的雇主...
负责设计、维护数据系统,确保财务报告和运营系统的可靠性和完整性。
关于Customer.io 8000多家公司...
Binance是全球领先的区块链生态系统,负责全球最大加密货币交易所。寻求具备区块链基础设施部署和管理经验的DevOps工程师,要求精通AWS、Kubernetes和CI/CD流程。