数据平台工程师 | AI(远程)
🔵 Reach IT - 近shore解决方案!我们的近shore专长使我们与众不同。我们专注于按需、可扩展的团队,技术卓越和运营可靠性。通过弥合人才缺口,我们支持组织构建稳健、安全且业务关键的数据平台。
加载中...
Intetics Inc.是一家全球科技公司,提供定制软件应用开发、分布式专业团队、软件产品质量评估以及‘all-things-digital’解决方案。该公司正在寻找一名资深的SRE/DevOps/基础设施工程师,负责构建和优化其分布式AI推理平台的基础设施。该平台基于AWS(包括EKS和托管MySQL)控制层,结合多外部供应商的GPU节点集群,通过定制网络层确保高可用性和性能。工作职责包括Kubernetes orchestration、observability工具(Prometheus、Grafana、Loki、Jaeger、OpenTelemetry)的使用,以及多供应商GPU基础设施的运维。
5年以上SRE、DevOps、平台工程或基础设施工程经验;具备生产环境中的网络和Kubernetes经验;有AWS生产环境经验,尤其是EKS;熟悉Linux主机、集群和分布式系统在非全抽象云供应商环境中的管理;熟悉Prometheus、Grafana、Loki、Jaeger和OpenTelemetry;有Helm、FluxCD和Terraform的部署和GitOps流程经验;有基础设施即代码经验(如Terraform);熟悉生产环境中的警报调优、运行书开发和实际事件管理;具备强操作判断力,能够独立排查问题、冷静应对事件并改进系统;适应快速发展的初创公司环境;能有效沟通并处理异步工作。
Intetics是一家全球科技公司,专注于定制软件开发、分布式专业团队、软件产品质量评估及‘all-things-digital’解决方案。公司致力于通过技术创新推动数字转型,目前处于快速成长阶段。
注册并登录后即可查看
🔵 Reach IT - 近shore解决方案!我们的近shore专长使我们与众不同。我们专注于按需、可扩展的团队,技术卓越和运营可靠性。通过弥合人才缺口,我们支持组织构建稳健、安全且业务关键的数据平台。
SemiAnalysis致力于弥合企业与全球最重要的行业之间的差距,专注于创新与增长。公司提供深入的分析和战略解决方案,帮助组织在专家指导下应对复杂挑战。基于对技术趋势的深刻理解,SemiAnalysis为客户提供具有影响力的成果。
职责 - 设计、部署和管理 Kubernetes 平台 - 维护基于 Terraform 的基础设施 - 改进 CI/CD 和 GitOps 流程 - 自动化部署、可观测性和运营流程 - 支持平台稳定性、事件响应和持续改进
职位名称:系统可靠性工程师,工作地点:西班牙,工作类型:永久制。职责包括为内部和外部客户提供技术支持,解决复杂问题,协调团队工作,确保应用数据按时加载并提供高质量服务。