职位描述

我们构建支持大规模人工智能的高性能GPU基础设施。我们的团队设计和操作大型NVIDIA DGX/HGX集群、高速网络以及自动化工具，将复杂硬件转化为可靠的生产级平台。我们直接与硬件打交道：部署节点、调优Linux、集成InfiniBand/RoCE，并构建使大规模AI基础设施可靠、可观测和安全的工具。

任职要求

7年以上系统、平台或分布式系统工程经验（Staff要求10年以上）。精通Linux：内核模块、sysctl调优、hugepages、容器运行时。有在物理硬件上部署Kubernetes或SLURM的经验。精通Go（首选）或Python进行系统级自动化。深入熟悉NVIDIA GPU生态系统（驱动、CUDA、MIG）。了解InfiniBand或RoCEv2网络和NCCL性能调优。有构建硬件加速环境可观测性流水线的经验。能够解决硬件、网络和编排之间的复杂多层问题。强大的跨团队沟通能力——你是网络、DCOps和软件团队之间的“粘合剂”。

福利待遇

年薪175,000至275,000美元 + 股票期权 + 完整福利

公司介绍

CyberCoders是一家专注于高性能计算和人工智能的科技公司，致力于构建支持大规模人工智能的高性能GPU基础设施。

高级平台工程师或高级工程师

职位描述

任职要求

福利待遇

公司介绍

应聘流程

相似职位

客户支持

BruntWork 雇佣客户支持团队经理 | LinkedIn

客户成功经理（远程）

客户服务管理员