FOO公司招聘中级DevOps工程师在埃及 | LinkedIn
关于我们:FOO自2009年成立以来,通过专注于技术、创新、专业性和质量,成为领先的金融科技提供商。与行业领先客户合作,FOO在中东地区迅速扩展,并设立了设计经验和质量的基准。FOO的愿景是扩大全球影响力,并对未来的科技产生积极影响。
加载中...
作为HPC SRE,您将负责大型GPU集群在AI和HPC工作负载中的可靠性、性能和可扩展性。您将跨裸金属和云原生环境工作,确保在极端规模下的高可用性和运营 excellence。
关键职责包括:管理并优化大型HPC/GPU集群(10万+ GPU)、负责集群可靠性、监控和事件响应、使用IaC工具(Ansible、Terraform)自动化基础设施、构建和维护可观测性堆栈(Prometheus、Grafana)、支持和扩展用于AI工作负载的Kubernetes平台、与网络和基础设施团队紧密合作在高性能织物上工作。
要求包括:在大规模HPC环境中具有Slurm的强烈经验、对InfiniBand和高性能网络的深入理解、在HPC、AI或云基础设施中的SRE/DevOps背景、使用Ansible、Kubernetes、Prometheus和Grafana的动手经验、在大规模裸金属环境中操作的经验。
注册并登录后即可查看
关于我们:FOO自2009年成立以来,通过专注于技术、创新、专业性和质量,成为领先的金融科技提供商。与行业领先客户合作,FOO在中东地区迅速扩展,并设立了设计经验和质量的基准。FOO的愿景是扩大全球影响力,并对未来的科技产生积极影响。
注意:谷歌的混合工作场所包括远程和办公角色。申请该职位时,您有机会选择以下地点之一:办公地点:中国上海、中国北京、中国深圳;远程地点:中国。
Valorem Reply,作为Reply网络的一部分,是微软基于IT解决方案的领导者。我们支持并指导我们的Giant Tech客户在微软的所有方面,以及其他行业领先的科技。从设计和开发定制解决方案和低代码解决方案,到无缝实施和管理,Valorem Reply帮助客户解锁其IT基础设施的潜力,以支持其销售和合作伙伴计划。
关于Ascend 背靠以人才为核心的Alpine投资者私人股权,Ascend正在为区域会计事务所构建一个动态平台,使他们能够在保持独立性的同时,获取顶级25强事务所的资源以帮助他们成长。Ascend提供访问成长资本、强大的人才招聘和培训、领先的质量管理资源、最佳的科技工具、AI工具、海外附属公司、共享后台服务、催化型领导力系统和现代化的股权激励方案,使事务所能够克服当今行业挑战,实现其最大潜力。