系统可靠性工程师 - 可观察性
CluePoints重新定义临床试验运行方式,作为风险基于质量管理(RBQM)和数据质量监控软件的领先提供商,利用先进统计学、人工智能和机器学习确保临床试验数据质量。寻找具备可观测性工程经验的系统可靠性工程师,负责提升平台和客户应用的端到端可观测性,专注于前端和真实用户监控(RUM)。
加载中...
CodeRound AI 为 Silicon Valley 和印度的快速成长、获得风投支持的 AI 和产品初创公司匹配顶级 5% 的技术人才。美国、英国、欧盟、阿联酋和印度的顶级初创公司信任 CodeRound 以招聘卓越的软件工程师、基础设施专家和 AI 构建者。你将负责:1. 管理基于 Kubernetes 的基础设施平台并扩展其规模;2. 推动 CI/CD 转型,包括 GitOps 工作流、发布自动化和多环境部署;3. 构建安全可靠的部署管道,包含 QA 管道和生产发布流程;4. 管理 Kubernetes 工作负载、自动扩展、入站、服务网格和基础设施配置;5. 为企业客户管理现场部署;6. 使用现代密钥管理平台迁移和管理密钥;7. 维护分支保护策略、CI 管道和基础设施安全最佳实践;8. 管理可观测性系统,包括指标、日志、跟踪、仪表板和警报;9. 监控平台可靠性,排查问题并提高系统韧性;10. 管理备份、灾难恢复和生产系统基础设施可靠性;11. 与工程团队紧密合作,提高开发人员体验和环境一致性。
你可能适合这个职位如果你:1. 具有 3 年以上 DevOps、平台工程或系统可靠性工程经验;2. 具有 Kubernetes 和容器化环境的实战经验;3. 熟练使用 Jenkins、GitHub Actions、GitLab CI 等 CI/CD 工具;4. 有 Docker、GitOps 工作流和基础设施即代码的经验;5. 有在 AWS、GCP 或 Azure 等云平台上的广泛经验;6. 有使用 Terraform、Ansible、Chef、Puppet 等自动化工具的经验;7. 理解网络、安全、密钥管理和生产运营;8. 有管理监控、日志和可观测性系统经验;9. 喜欢排查复杂分布式系统和生产问题;10. 在快速发展的初创公司环境中享受高自主权。
CodeRound AI 是一家获得风投支持的初创公司,已筹集到200万美元的资金。
注册并登录后即可查看
CluePoints重新定义临床试验运行方式,作为风险基于质量管理(RBQM)和数据质量监控软件的领先提供商,利用先进统计学、人工智能和机器学习确保临床试验数据质量。寻找具备可观测性工程经验的系统可靠性工程师,负责提升平台和客户应用的端到端可观测性,专注于前端和真实用户监控(RUM)。
关于Telnyx Telnyx是行业领导者,我们不仅在想象全球连接的未来,我们正在建造它。从设计和放大私有、全球、多云IP网络的范围...
About The Job We are looking for a senior site reliability engineer to join the Cloud FinOps team at Hopper. We manage a large infrastructure in Google Cloud that is used by hundreds of engineers to provide a first class...
Telnyx是行业领导者,我们不是在想象全球连通性的未来——我们正在建造它。从构建和放大一个私有、全球、多云IP网络,到通过直观的API将超本地边缘技术带到您的指尖,我们正在塑造无缝连接人、设备和应用的新时代。