数据平台工程师 | AI(远程)
🔵 Reach IT - 近shore解决方案!我们的近shore专长使我们与众不同。我们专注于按需、可扩展的团队,技术卓越和运营可靠性。通过弥合人才缺口,我们支持组织构建稳健、安全且业务关键的数据平台。
加载中...
一家快速增长的科技公司正在构建面向现代AI工作负载的基础设施层——一个全球分布的平台,提供可扩展、成本高效且可靠的GPU计算资源访问。该平台使客户能够在多样化的提供商网络中运行生产级推理工作负载,提供灵活性、性能和现实世界AI应用所需的可靠性。自启动以来,公司已显示出强劲的 traction,获得了显著的Series A投资,并在第一年实现了数百万的ARR。随着客户需求和平台规模的持续扩展,团队正在积极扩展其基础设施能力以支持下一阶段的发展。该职位需要一名强大的SRE/DevOps/基础设施工程师,帮助扩展和运营一个面向AI的分布式基础设施平台。
5年以上SRE、DevOps、平台工程或基础设施工程经验;有生产环境中网络和Kubernetes的强经验;有AWS生产环境经验,特别是EKS;有管理Linux主机、集群和分布式系统经验,环境不完全抽象于主要云提供商;有Prometheus、Grafana、Loki、Jaeger和OpenTelemetry的经验;有使用Helm和FluxCD等工具进行部署和GitOps工作流的经验;有基础设施即代码经验,理想情况下是Terraform;熟悉警报调优、运行书开发和生产系统中的实际事件管理;有强的操作判断:能够独立排查问题,冷静应对事件,无需持续指导;能适应快速发展的初创企业,基础设施、产品和客户需求变化快;能有效沟通,能在异步环境中工作并处理轮班交接。
Intetics Inc.是一家全球科技公司,提供定制软件开发、分布式专业团队、软件产品质量评估和‘all-things-digital’解决方案。
注册并登录后即可查看
🔵 Reach IT - 近shore解决方案!我们的近shore专长使我们与众不同。我们专注于按需、可扩展的团队,技术卓越和运营可靠性。通过弥合人才缺口,我们支持组织构建稳健、安全且业务关键的数据平台。
SemiAnalysis致力于弥合企业与全球最重要的行业之间的差距,专注于创新与增长。公司提供深入的分析和战略解决方案,帮助组织在专家指导下应对复杂挑战。基于对技术趋势的深刻理解,SemiAnalysis为客户提供具有影响力的成果。
职责 - 设计、部署和管理 Kubernetes 平台 - 维护基于 Terraform 的基础设施 - 改进 CI/CD 和 GitOps 流程 - 自动化部署、可观测性和运营流程 - 支持平台稳定性、事件响应和持续改进
职位名称:系统可靠性工程师,工作地点:西班牙,工作类型:永久制。职责包括为内部和外部客户提供技术支持,解决复杂问题,协调团队工作,确保应用数据按时加载并提供高质量服务。